我正在进行一个项目,其中每个要排序的实体都是,不是单个文档,而是实际上一组文档。
因此,排名不仅涉及到标准搜索引擎评分参数,而且还涉及到实体/组中文档的关联。更准确地说,组内文档的关联也是对排名的贡献。
关联的计算是特定于这个问题的安静的东西,我已经有了一个工作代码。
我刚刚开始使用 Lucene ,因此我不知道这个功能是否可以用Lucene实现。
可以用Lucene?来完成吗?
Solr?
如果没有,请给我一个同样的出路。
发布于 2012-08-21 09:19:43
您可能需要深入研究Lucene评分代码。也许你可以计算你的联想得分,并将其与常规的lucene评分相结合。
0/api/core/org/apache/lucene/search/package-summary.html#scoring
发布于 2012-08-21 14:24:05
你可以分组是solr。group=on&group.field=field。
默认情况下,它将返回一个单独的组列表。而不是返回组作为主要结果。
你可以用你自己的系统来打分和推广某些领域等等。我不知道你如何获得该组中文档的总得分。或者如果需要的话,solr 4有group.func
http://wiki.apache.org/solr/FieldCollapsing
希望这有帮助,如果没有,对不起:)
发布于 2012-08-22 01:07:03
是的你可以在Lucene做这件事。有关更多信息,请查看函数查询。您可以在卢塞尼行动书中找到大量信息(从第185页开始)。
https://stackoverflow.com/questions/12050665
复制相似问题