我在标准分析器中使用ElasticSearch和Lucene。当查询是"Paleo“时,我想让我的索引不返回”古生物学“的结果。然而,我确实希望它返回与“旧石器”相关的“旧石器”的结果。换句话说,我希望分析器更智能,过滤掉与关键字无关的词干,同时保留与关键字相关的词干。我有哪些可用的解决方案?
发布于 2014-06-24 02:48:28
实现您自己的词干分析过滤器(或扩展现有的过滤器)。标准分析器不使用词干分析,所以我不确定您使用的是哪个词干分析器。不过,这是Lucene中的PorterStemmer。
http://lucene.apache.org/core/4_1_0/analyzers-common/org/apache/lucene/analysis/en/PorterStemFilter.html
如果这看起来太复杂,您可以在词干分析器之后添加一个StopWord过滤器,然后只拒绝您想要的标记。
https://stackoverflow.com/questions/17660813
复制相似问题