我一直在使用Lucene中的标准Analyzer进行索引和搜索。我最近遇到了Shingles (2单词shingles\bigram),到目前为止,我在研究中发现的唯一优势是,短语搜索会更快。不利的一面是,我的索引大小增加了。我不太确定我的应用程序使用Shingles会有什么真正的优势和功能。如果我使用Shingles/NGramTokenizer对我的文档进行标记化来建立索引,它会如何影响我的其他现有搜索(Stem\Fuzzy等搜索)?
有没有人能解释一下这个话题?
发布于 2016-12-05 22:11:09
它不会影响你的其他搜索,但索引的大小将非常大,与使用标准分析器索引的相比。
https://stackoverflow.com/questions/40974753
复制相似问题