我们正在努力创建一个波斯搜索引擎的团队工作。我正在做“索引”部分。我使用了Solr,并对一些英文文档进行了索引,看看它是否有效。啊,真灵!现在是波斯索引器的时候了。我为PersianAnalyzer优化了一点代码(例如,扩展了停用字集),它可以为文档建立索引。现在,我希望将外部波斯文索引文档导入到核心,以查看索引过程并在其上搜索查询。我如何才能做到这一点并将这些索引文档导入到核心?我有点赶时间,所以我将非常感谢任何帮助。
谢谢你,马希德
发布于 2017-01-17 21:23:21
您有几个选项:
从文件中获取内容的最快选择是使用Apache Nutch. DataImportHandler;
https://stackoverflow.com/questions/41696971
复制相似问题