首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >DCG测度的两个定义

DCG测度的两个定义
EN

Data Science用户
提问于 2018-08-10 13:29:26
回答 1查看 244关注 0票数 2

我想检查原论文贾维林中关于折现累积增益的定义,它似乎与后来的文献中的定义不同。最初,对于从$r = 1,\ldots,p$排序的$r文档,$\text{DCG}_p$定义为$$\text{DCG}_p =\sum\limits_{r=1}{b} G_r +\sum\limits_{r=b}{p}{G_r}{\log_br},$$中$G_i$是$i-th文档的相关性(或增益)。因此,度量取决于对数基$b$。对于低于$b$的等级,即$r维基百科上给出的参数不同,其中对数的参数移动了$1:$$\text{DCG}_p = G_1 +.$$。

这种变化从何而来?为什么其他人使用不同的度量?

EN

回答 1

Data Science用户

发布于 2018-08-10 14:21:34

我相信你是对的,报纸和维基百科意见不一致。该文件的公式建议您在$r <= b$不提供折扣,这意味着前两个元素都不打折。

维基百科的公式将第二个元素打折扣。

在讨论为什么维基百科公式是正确的:https://en.wikipedia.org/wiki/Talk:Discounted_累积性_增益时,有一个充满激情的声明

但我看不出原因;它除了指出“从第二个要素中不打折扣似乎显然是错误的”之外,并没有提供任何其他参考。我会在这里发表评论。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/36742

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档