当使用match all查询(*:*)发出相同的查询时,我总是得到不同的集群和分数。可能的原因是什么?
第一次尝试:
label: "В Минске"
score: 52.79549568196028第二次尝试:
label: "В Минске"
"score": 54.74385944060893第三次尝试:
label: "В Минске"
"score": 48.884082925408734集群内的文档ids也不同。集群本身发生了变化:在一个查询响应中,我得到了一个集群“тысячамиевро”,在随后的查询响应中,它消失了,但新的集群出现了:“ТысячамиДолларов”。
对于给定的查询,是否有一些胡萝卜参数可以使集群稳定?可能是desiredClusterCountBase吗?
Solr索引对于所有情况都是相同的。使用的算法:使用StopWordLabelFilter.enabled=false和clustering.rows=1000的org.carrot2.clustering.lingo.LingoClusteringAlgorithm。
发布于 2018-11-02 05:32:01
看起来我找到了原因:
我不知道这是否仍然是一个bug,但是从索引中删除所有文档并将它们放回正确的发布日期已经解决了这个问题。
https://stackoverflow.com/questions/53101839
复制相似问题