在2013年PyCon幻灯片中提到了近类型查询。我查看了文档,查询中没有提到NEAR关键字。我只能找到类似的东西
"whoosh library"~5,如果文档在“whoosh”后面的5个单词内有“库”,则匹配。
我想知道是否有一种方法可以进行这样的查询:
'whoosh' NEAR:X 'python' NEAR:X 'retrieval'其中,X表示查询词之间的最大单词数(即“whoosh”、“python”、“检索”)
发布于 2014-12-31 18:19:55
我再次浏览了文档并找到了SpanNear2类,这似乎完成了工作,例如三个术语:
t1 = query.Term("sentence", "Whoosh")
t2 = query.Term("sentence", "python")
t3 = query.Term("sentence", "retrieval")
q = spans.SpanNear2([t1, t2, t3], slop=5, ordered=True)这将匹配一个包含如下句子的文档:
"The Whoosh project is a python library for information retrieval."但不是这句话:
"Whoosh is a great open source project is a python for information retrieval."因为在'Whoosh‘和python与slop=5之间有8个令牌
https://stackoverflow.com/questions/27723033
复制相似问题