我们正在考虑使用Websolr插件在我们的Rails应用程序中搜索资源。
该应用程序包含许多资源模型。大多数资源模型都是自包含的,具有一系列属性:作者、标题、一组标记等,但是有些资源模型附加了pdf。我们需要索引此pdf的内容,以便它可以作为资源的一部分进行搜索。
我应该如何处理这个问题?
发布于 2013-02-24 23:55:28
这应该可以让您开始使用:ExtractingRequestHandler,它将Tika集成到Solr中。
https://stackoverflow.com/questions/15051264
复制相似问题