首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >滑雪板中nDCG的输入

滑雪板中nDCG的输入
EN

Stack Overflow用户
提问于 2018-04-23 20:03:57
回答 1查看 5.3K关注 0票数 12

我无法理解sklearn:score.html的输入格式

目前,我有以下问题:我有多个查询,每个查询的排名概率都已成功计算出来。但是现在的问题是计算测试集的nDcg,我想要对它使用sklearn。在链接上给出的示例

代码语言:javascript
复制
>>> y_true = [1, 0, 2]
>>> y_score = [[0.15, 0.55, 0.2], [0.7, 0.2, 0.1], [0.06, 0.04, 0.9]]
>>> ndcg_score(y_true, y_score, k=2)
1.0

据网站介绍,y_true是地面真理,y_score是probabilities.So,以下是我的问题:

  1. 此示例仅用于一个查询还是多个查询?
  2. 如果这只是一个查询,那么y_true代表什么:原始排名?
  3. 如果这是针对一个查询,为什么我们有多个输入概率?
  4. 如何将该方法应用于多个查询及其产生的概率?
EN

回答 1

Stack Overflow用户

发布于 2018-09-05 14:06:34

您可以类似于多类分类问题。

所以回答你的问题

  1. 此示例仅用于一个查询还是多个查询?

一次查询

  1. 如果这只是一个查询,那么y_true代表什么:原始排名?

我把它称为文件的相关标签,因为它可能有重复的值。

  1. 如果这是针对一个查询,为什么我们有多个输入概率?

y_score是属于某个类的文档的概率分布。在您的示例中,y_score = [[0.15, 0.55, 0.2], [0.7, 0.2, 0.1], [0.06, 0.04, 0.9]]意味着第0文档属于第1类(0.55为最大),第1文档属于类0 (0.7为最大),第2文档属于第2类(0.9为最大值)。缺乏文档,而且示例也具有误导性。最好有四份文件。

  1. 如何将该方法应用于多个查询及其产生的概率?

然后,您可以在多个查询中平均每个查询的nDCG分数。

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49989128

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档