首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Lucene和昵称匹配

Lucene和昵称匹配
EN

Stack Overflow用户
提问于 2013-03-11 10:52:34
回答 2查看 266关注 0票数 1

我有一系列包含昵称(甚至包含空格)和ID的文档。

昵称可以是"example","nick n4me","nosp4ces","A fancy“。

我必须找到一个查询,它允许我通过完美匹配、模糊或带有部分字符的事件来查找配置文件。

因此,如果写下"nick“或"nick name”或"nick name",文件"nickname“总是要出来的。

我尝试了一些类似这样的东西:

代码语言:javascript
复制
nickname:(%1%^4 %1%~^3 %1%*^1) 

其中"%1%“是我正在搜索的,但它不起作用,特别是对于空格或数字昵称。例如,如果我尝试搜索"nick n“,查询将是:

代码语言:javascript
复制
nickname:(nick n^4 nick n~^3 nick n*^1) 
EN

回答 2

Stack Overflow用户

发布于 2013-03-11 17:17:30

使用^提升只会影响评分,而不会影响匹配,也就是说,如果你的查询根本不匹配,提升或不提升术语都不会有任何影响。

在您的特定示例中,查询将不匹配,因为:

1) nick n不匹配,因为这需要令牌nickn已经被标记化;

2)编辑:我发现,如果你使用标准的查询解析器,模糊查询只适用于单个术语。在您的例子中,您可能应该使用ComplexPhraseQueryParser重写nick n~,这样您就可以对整个PhraseQuery执行模糊查询。此外,您还可以为您的模糊查询指定阈值(从技术上讲,您指定的是最小Levenshtein距离)。显然,您必须调整阈值,这通常需要进行一些试验和错误。

票数 0
EN

Stack Overflow用户

发布于 2013-03-30 04:59:30

一种更简单的策略是将所有昵称加载到一个字段中--在本例中,昵称字段有4个值。如果您希望在昵称中嵌入空格,则需要使用比StandardAnalyzer更简单的分析器或使用短语搜索。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15330451

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档