我正试着从巫婆Nutch的元标记中索引一些元数据。我已经一步一步地完成了教程Nutch - Parse Metatag,但是没有任何索引。
我已经配置了插件,像一步一步的教程。当我运行爬行进程时,我可以在日志中读取15个文档的索引,但是当我从弹性的角度看时,我看不到它们。创建了索引,但它有0个文档。日志中没有错误。
索引器:索引、删除或跳过的文档数: 索引器:15个索引(添加/更新) 索引器:完成于2017-12-20 12:42:58,运行时间: 00:00:04
如果我删除索引元数据插件并重新运行爬行过程,文档是用弹性编写的,但是它们没有元标记。
我怎么才能用Nutch和Elastic爬行这些美甲呢?为什么当我激活插件时任何东西都会被索引?
我用的是带有弹性的阿帕奇-纳奇-1.13。
发布于 2017-12-22 08:42:29
我找到了解决办法。弹性是由于字段名而造成的错误。插件正在创建的名称是“元数据。*”。弹性不接受字段名中的点。要解决这个问题,您必须配置没有前缀“metedata”的索引元数据。此前缀仅用于Solr。
<property>
<name>metatags.names</name>
<value>description,keywords</value>
<description>...</description>
</property>
...
<property>
<name>index.parse.md</name>
<value>description,keywords</value>
<description>...</description>
</property>https://stackoverflow.com/questions/47908485
复制相似问题