文章/答案/技术大牛

发布

社区首页 >问答首页 >推荐系统的离线评估

问推荐系统的离线评估
EN

Data Science用户

提问于 2020-03-12 16:09:33

回答 2查看 1.8K关注 0票数 2

假设我想比较一下一种推荐系统(A)是否比另一种(B)更好。

一种方法是让人们对这两个系统返回的建议进行评分。

然而，在某些情况下，我想评估我的推荐系统离线。我考虑过的一种方法是收集来自system的建议的用户评等，并将它们转换为测试数据集。但是，如果system返回没有出现在测试数据集中的建议，这并不意味着它们是坏的。这只意味着我对他们没有评价。

一些替代办法：

尽量增加测试数据集的数量，以增加推荐人之间的重叠。
限制项目空间的大小，让推荐从500选择项目，而不是5*10^6项目在测试期间。

你还会推荐什么其他方法呢？

recommender-system

model-evaluations

回答 2

Data Science用户

发布于 2020-04-28 17:29:21

在推荐系统中，离线测试总是存在偏见。真实的评价发生在A/B测试中。但是，这不应该阻止人们进行离线测试。

目前正在利用多武装匪徒对这一问题进行研究。我建议使用健身馆阅读脱机测试过程。

在工作坊之后，我们将讨论如何消除这些偏见，并为推荐系统开发高效的离线估计器。他们还对推荐系统进行了一次有效的离线评估( 在线课程 )。

您还可以在反事实评价上的这个网站上学习视频教程。

票数 1

Data Science用户

发布于 2020-10-16 14:06:59

传统的离线评估使用从机器学习和信息检索中借用的度量和方法来估计建议的执行情况。他们可能是偏见，但他们是芯片替代。

离线评估遵循培训测试评估过程：

1.将用户数据分割为训练集和测试集。

2.针对每个用户的培训set.For的培训推荐算法：

2.1.产生一份建议清单

2.2.检验预测精度或排序效果

对于通常将用户数据分割成训练集和测试集的部分，在训练推荐时删除一部分数据，然后将其作为一个真实的基础。

在您的例子中，我将计算两个RS的度量，并比较结果，当然使用相同的数据。有关评估的更多信息，可以在https://scholarworks.boisestate.edu/cgi/viewcontent.cgi?article=2703&context=td中阅读。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/69590

复制

相似问题

问推荐系统的离线评估
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问推荐系统的离线评估EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问推荐系统的离线评估
EN