我正在考虑将语义分析添加到我的Solr安装中,但我不知道从哪里开始。
基本上,我希望Solr能够找到“相似”的单词(取自索引文档的正文)。例如,如果我搜索“音乐”,我应该能够查询语义引擎并获得“摇滚”、“流行音乐”等(当然,如果这些词在某些索引文档中出现在音乐附近)。
我找到了这个项目,但我不知道它是否是正确的起点:http://code.google.com/p/semanticvectors/
发布于 2009-07-21 09:48:10
您可以使用Lucene Wordnet contrib package查找同义词。
Optimizing Findability in Lucene and Solr提供了扩展查询的其他方法。
发布于 2009-07-21 13:35:17
语义索引是一个很好的起点。然而,根据我的经验,这些技术在实践中并不能很好地工作。你经常会得到非常奇怪的结果。此外,由于谷歌,人们对关键字搜索应该如何表现有一定的期望-即你的搜索词应该出现在匹配的文档中。
https://stackoverflow.com/questions/1157937
复制相似问题