首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ShingleFilter\n-GramTokenizer的优点?

ShingleFilter\n-GramTokenizer的优点?
EN

Stack Overflow用户
提问于 2016-12-05 20:53:56
回答 1查看 53关注 0票数 1

我一直在使用Lucene中的标准Analyzer进行索引和搜索。我最近遇到了Shingles (2单词shingles\bigram),到目前为止,我在研究中发现的唯一优势是,短语搜索会更快。不利的一面是,我的索引大小增加了。我不太确定我的应用程序使用Shingles会有什么真正的优势和功能。如果我使用Shingles/NGramTokenizer对我的文档进行标记化来建立索引,它会如何影响我的其他现有搜索(Stem\Fuzzy等搜索)?

有没有人能解释一下这个话题?

EN

回答 1

Stack Overflow用户

发布于 2016-12-05 22:11:09

它不会影响你的其他搜索,但索引的大小将非常大,与使用标准分析器索引的相比。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40974753

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档