首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >推荐系统的离线评估

推荐系统的离线评估
EN

Data Science用户
提问于 2020-03-12 16:09:33
回答 2查看 1.8K关注 0票数 2

假设我想比较一下一种推荐系统(A)是否比另一种(B)更好。

一种方法是让人们对这两个系统返回的建议进行评分。

然而,在某些情况下,我想评估我的推荐系统离线。我考虑过的一种方法是收集来自system的建议的用户评等,并将它们转换为测试数据集。但是,如果system返回没有出现在测试数据集中的建议,这并不意味着它们是坏的。这只意味着我对他们没有评价。

一些替代办法:

  • 尽量增加测试数据集的数量,以增加推荐人之间的重叠。
  • 限制项目空间的大小,让推荐从500选择项目,而不是5*10^6项目在测试期间。

你还会推荐什么其他方法呢?

EN

回答 2

Data Science用户

发布于 2020-04-28 17:29:21

在推荐系统中,离线测试总是存在偏见。真实的评价发生在A/B测试中。但是,这不应该阻止人们进行离线测试。

目前正在利用多武装匪徒对这一问题进行研究。我建议使用健身馆阅读脱机测试过程。

工作坊之后,我们将讨论如何消除这些偏见,并为推荐系统开发高效的离线估计器。他们还对推荐系统进行了一次有效的离线评估( 在线 课程 )。

您还可以在反事实评价上的这个网站上学习视频教程。

票数 1
EN

Data Science用户

发布于 2020-10-16 14:06:59

传统的离线评估使用从机器学习和信息检索中借用的度量和方法来估计建议的执行情况。他们可能是偏见,但他们是芯片替代。

离线评估遵循培训测试评估过程:

1.将用户数据分割为训练集和测试集。

2.针对每个用户的培训set.For的培训推荐算法:

2.1.产生一份建议清单

2.2.检验预测精度或排序效果

对于通常将用户数据分割成训练集和测试集的部分,在训练推荐时删除一部分数据,然后将其作为一个真实的基础。

在您的例子中,我将计算两个RS的度量,并比较结果,当然使用相同的数据。有关评估的更多信息,可以在https://scholarworks.boisestate.edu/cgi/viewcontent.cgi?article=2703&context=td中阅读。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/69590

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档