给出了如下模型:
{
[Key]
public string Id { get; set; }
[IsSearchable]
[Analyzer(AnalyzerName.AsString.Keyword)]
public string AccountId { get; set; }
}AccountId的示例数据如下所示:
1-ABC123
1-333444555
1-A4KK498该字段可以任意组合字母/数字和中间的一个破折号。
我需要能够使用像1-ABC*这样的查询来搜索这个字段。然而,没有一个基本的分析器似乎支持破折号除了关键字,它没有任何通配符查询,只有完全匹配。我看过其他一些关于自定义分析器的文章,但我无法获得足够的信息,说明如何构建它来解决这个问题。
我需要知道我是否必须为这个领域构建一个客户分析器,我是否需要一个不同的搜索分析器和索引分析器?
我在其他没有破折号的字母数字字段中使用StandardLucene,还有另一个带破折号的字段,但它都是数字,关键字在那里工作得很好。问题似乎是字母和数字的混合。
发布于 2019-03-26 17:51:06
自定义分析器确实是这里的方法。基本上,您可以定义一个自定义分析器,它使用带有“小写”令牌过滤器的“关键字”标记器。
将自定义分析器添加到Index类,并更改模型中的分析器名称以匹配自定义分析器名称:
new Index()
{
...
Analyzers = new[]
{
new CustomAnalyzer()
{
Name = "keyword_lowercase",
Tokenizer = TokenizerName.Keyword,
TokenFilters = new[] { TokenFilterName.Lowercase }
}
}
}型号:
{
[Key]
public string Id { get; set; }
[IsSearchable]
[Analyzer("keyword_lowercase")]
public string AccountId { get; set; }
}在REST中,这看起来类似于:
{
"fields": [{
"name": "Id",
"type": "Edm.String",
"key": true
},
{
"name": "AccountId",
"type": "Edm.String",
"searchable": true,
"retrievable": true,
"analyzer": "keyword_lowercase"
}],
"analyzers":[
{
"name":"keyword_lowercase",
"@odata.type":"#Microsoft.Azure.Search.CustomAnalyzer",
"tokenizer":"keyword_v2",
"tokenFilters":["lowercase"]
}
]
}https://stackoverflow.com/questions/55346822
复制相似问题