我有一个使用lucene.Net的应用程序,在搜索短语/术语中使用Lucene的同义词特性有困难。
例如,如果我想搜索单词"superman",并设置了一个同义词:“蜘蛛侠”,我希望(并且确实)返回与“蜘蛛侠”以及“超人”相关的结果。
现在我想要的是搜索“正义联盟”,并为该术语设置一个同义词,称为“复仇者”。
还说“超人”和同义词“正义联盟”。
你有点像我说的那样。总之,我想有能力设置多短语同义词。我知道同义词确实是1字对1字,但是对于Lucene.NET或Lucene本身是否有任何自定义的方法来解决这个问题。我听说lucene正在添加这个特性,但是我在环顾四周时还没有看到任何有用的东西。
谢谢艾德
发布于 2014-07-18 09:43:36
看看solr.SynonymFilterFactory
请记住,虽然SynonymFilter会很高兴地使用包含多个单词的同义词(例如:"sea biscit、sea biscit、seabiscuit"),但建议的处理此类同义词的方法是在索引时扩展同义词。这是因为在查询时可能会出现两个潜在的问题:
https://stackoverflow.com/questions/23014175
复制相似问题