我计划在数据集上使用dl4j,该数据集的格式如下:
{“文章”:[{“abstractText”:“文本.”、“日记”:“日记.”、"meshMajor":"mesh1“、.、"meshN”、“PMID”:“mesh1”、“标题”:“标题.”、“年份”:“YYYY}、.}]}}
字段meshMajor包含类标签,其余的是模型的输入。输入特性是文本数据。
我想知道是否有像CSV这样的JSON数据集迭代器。我查阅了github上的例子,但是找不到一个。如果没有可用的,可以有人提供一些关于实现它的提示吗?
谢谢!
发布于 2019-06-07 03:25:41
在DL4J的gitter中询问了这个Q,解决方案是使用Jackson记录读取器。其他详细信息可用https://github.com/deeplearning4j/DataVec/tree/master/datavec-api/src/main/java/org/datavec/api/records/reader/impl/jackson,读取JSON的示例可在
注意,JacksonLineRecordReader和JacksonRecordReaderTest.java之间有一个区别,前者要求每个JSON记录正好跨越一行,后者要求每个JSON记录都有一个文件。
发布于 2019-05-28 08:01:13
https://stackoverflow.com/questions/56326463
复制相似问题