我们正在努力把短语组合在一起,以提高结果。
例如,如果用户问“我什么时候必须更换空调的过滤器?”对于特定领域的短语,如“空调”,R&R返回一些包含“空气”一词的答案,而不包含“空调”,或者返回包含其他术语的答案,如安全气囊或空气过滤器。
这可以使用原始Solr实例完成,并在引号之间设置短语。因此,Solr查询如下所示:
...
"debug": {
"rawquerystring": "When do I have to change the filter of my \"air conditioning\" ?",
"querystring": "When do I have to change the filter of my \"air conditioning\" ?",
"parsedquery": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my PhraseQuery(text:\"air conditioning\") text:?",
"parsedquery_toString": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my text:\"air conditioning\" text:?",
...然而,R&R指南声明:
该语法与标准Solr语法不同,如下所示: 你可以搜索一个词,或者一个短语。您不需要像Solr那样用双引号环绕短语,但是您可以在查询中包含短语,它们由ranker模型负责。
我们找不到关于上述声明的更多细节。
但是,据我们所知,牧羊人应该识别词组。如果是这样的话,我们想知道是否有一种方法,我们可以设置一个词组字典,以调音?或者,我们可以建立我们自己的法律用语模式吗?实现这一目标的选择是什么?
谢谢
发布于 2016-04-21 13:56:24
目前,RnR不支持严格的短语查询,尽管有些功能会考虑术语排序和相邻术语。我们正在开发一个新版本的服务,在该版本中,用户可以使用完整的常规solr查询语法(包括指定短语)检索文档。
https://stackoverflow.com/questions/36701868
复制相似问题