首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >nutch索引-元数据不索引

nutch索引-元数据不索引
EN

Stack Overflow用户
提问于 2017-12-20 14:41:01
回答 1查看 379关注 0票数 1

我正试着从巫婆Nutch的元标记中索引一些元数据。我已经一步一步地完成了教程Nutch - Parse Metatag,但是没有任何索引。

我已经配置了插件,像一步一步的教程。当我运行爬行进程时,我可以在日志中读取15个文档的索引,但是当我从弹性的角度看时,我看不到它们。创建了索引,但它有0个文档。日志中没有错误。

索引器:索引、删除或跳过的文档数: 索引器:15个索引(添加/更新) 索引器:完成于2017-12-20 12:42:58,运行时间: 00:00:04

如果我删除索引元数据插件并重新运行爬行过程,文档是用弹性编写的,但是它们没有元标记。

我怎么才能用Nutch和Elastic爬行这些美甲呢?为什么当我激活插件时任何东西都会被索引?

我用的是带有弹性的阿帕奇-纳奇-1.13。

EN

回答 1

Stack Overflow用户

发布于 2017-12-22 08:42:29

我找到了解决办法。弹性是由于字段名而造成的错误。插件正在创建的名称是“元数据。*”。弹性不接受字段名中的点。要解决这个问题,您必须配置没有前缀“metedata”的索引元数据。此前缀仅用于Solr。

代码语言:javascript
复制
<property>
  <name>metatags.names</name>
  <value>description,keywords</value>
  <description>...</description>
</property>
...
<property>
  <name>index.parse.md</name>
  <value>description,keywords</value>
  <description>...</description>
</property>
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47908485

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档