我创建了一个基于文本相似度(余弦相似度)的查询文档对之间的两级排序系统。现在我需要验证我的排名系统,对于用户来说,检索到的适当排序项是否正确,我应该选择哪种方法。我读过关于Pointwise/成对/列表方法来验证排名,但是手动评估排名系统,这会更有帮助。如果有人能启发出一种更好的评价方法,这将对我很有帮助。谢谢
发布于 2016-12-23 23:12:43
如果我的问题是正确的,你正在寻找一个评估方法,以确定你的两阶段检索系统是否运行良好。如果这是真的,则可以使用下列评估方法之一:
在上述战略中,第一项应该更容易和更便宜。您只需要访问TREC数据,这不是私有的(但您需要支付数百美元才能访问其中的大多数数据)。
https://stackoverflow.com/questions/40843465
复制相似问题