首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在solr core中导入索引文档的外部文件

如何在solr core中导入索引文档的外部文件
EN

Stack Overflow用户
提问于 2017-01-17 20:19:17
回答 1查看 93关注 0票数 0

我们正在努力创建一个波斯搜索引擎的团队工作。我正在做“索引”部分。我使用了Solr,并对一些英文文档进行了索引,看看它是否有效。啊,真灵!现在是波斯索引器的时候了。我为PersianAnalyzer优化了一点代码(例如,扩展了停用字集),它可以为文档建立索引。现在,我希望将外部波斯文索引文档导入到核心,以查看索引过程并在其上搜索查询。我如何才能做到这一点并将这些索引文档导入到核心?我有点赶时间,所以我将非常感谢任何帮助。

谢谢你,马希德

EN

回答 1

Stack Overflow用户

发布于 2017-01-17 21:23:21

您有几个选项:

从文件中获取内容的最快选择是使用Apache Nutch. DataImportHandler;

  • another选项是编写自定义爬虫/索引器,但这将需要时间;

  • 如果您需要使用web爬虫程序,则可以使用Solr
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41696971

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档