文章/答案/技术大牛

发布

社区首页 >问答首页 >滑雪板中nDCG的输入

问滑雪板中nDCG的输入
EN

Stack Overflow用户

提问于 2018-04-23 20:03:57

回答 1查看 5.3K关注 0票数 12

我无法理解sklearn：score.html的输入格式

目前，我有以下问题:我有多个查询，每个查询的排名概率都已成功计算出来。但是现在的问题是计算测试集的nDcg，我想要对它使用sklearn。在链接上给出的示例

>>> y_true = [1, 0, 2]
>>> y_score = [[0.15, 0.55, 0.2], [0.7, 0.2, 0.1], [0.06, 0.04, 0.9]]
>>> ndcg_score(y_true, y_score, k=2)
1.0

据网站介绍，y_true是地面真理，y_score是probabilities.So，以下是我的问题：

此示例仅用于一个查询还是多个查询？
如果这只是一个查询，那么y_true代表什么:原始排名？
如果这是针对一个查询，为什么我们有多个输入概率？
如何将该方法应用于多个查询及其产生的概率？

python

machine-learning

scikit-learn

ranking

xgboost

回答 1

Stack Overflow用户

发布于 2018-09-05 14:06:34

您可以类似于多类分类问题。

所以回答你的问题

此示例仅用于一个查询还是多个查询？

一次查询

如果这只是一个查询，那么y_true代表什么:原始排名？

我把它称为文件的相关标签，因为它可能有重复的值。

如果这是针对一个查询，为什么我们有多个输入概率？

y_score是属于某个类的文档的概率分布。在您的示例中，y_score = [[0.15, 0.55, 0.2], [0.7, 0.2, 0.1], [0.06, 0.04, 0.9]]意味着第0文档属于第1类(0.55为最大)，第1文档属于类0 (0.7为最大)，第2文档属于第2类(0.9为最大值)。缺乏文档，而且示例也具有误导性。最好有四份文件。

如何将该方法应用于多个查询及其产生的概率？

然后，您可以在多个查询中平均每个查询的nDCG分数。

票数 6

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/49989128

复制

相似问题

问滑雪板中nDCG的输入
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问滑雪板中nDCG的输入EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问滑雪板中nDCG的输入
EN