我使用solr搜索引擎来实现我的文档检索项目。我的数据集是.txt文件格式。但solr只提供了json、xml、pdf和其他一些文件格式的选项。没有用于文本文件的选项。
为了使用.txt文件作为数据集,我需要在solr中做一些修改吗?
发布于 2014-04-05 01:59:50
你所需要做的就是索引你的txt文件。
有关更多信息和具体示例,请查看此处- http://www.slideshare.net/LucidImagination/indexing-text-and-html-files-with-solr-4063407
发布于 2014-04-05 16:33:44
最有可能的是,您将在.txt files.So中使用空格分隔的文档来索引.txt文件,您可以编写python脚本将您的文档流式传输到solr并执行提交。
发布于 2014-04-09 03:43:49
除了txt文件,Solr还可以索引其他几种文档格式。有关详细信息,请查看Apache Tika。
https://stackoverflow.com/questions/22867889
复制相似问题