我想使用solr的DIH deltaimport来导入nutch导出的mysql数据,但是nutch的mysql数据没有时间戳字段。我尝试从Mysql导入的原因是,我想将抓取数据合并到其他url管理表中。爬网数据中的"modifiedTime“字段为bigInt而不是timeStamp,并且始终为空。我研究了这个问题,我认为索引筛选器插件可以解决这个问题。是对的吗?
nutch 2.1 Solr 3.6
发布于 2013-12-10 19:19:20
在索引之前尝试使用ScriptTransformer来转换每个不一致的数据,我希望这个URL对您有用:http://wiki.apache.org/solr/DataImportHandler#ScriptTransformer
https://stackoverflow.com/questions/20435825
复制相似问题