首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用于协作过滤的基准数据集

用于协作过滤的基准数据集
EN

Data Science用户
提问于 2016-03-23 13:46:49
回答 2查看 6.5K关注 0票数 10

我想测试一种新的协同过滤算法。一个典型的用例是根据类似于特定用户的用户偏好推荐电影。

研究人员经常使用哪些常用的基准数据集来测试他们的算法?我知道,在计算机视觉中,人们经常使用MNIST或CIFAR,但我还没有找到用于协作过滤的类似数据集。

EN

回答 2

Data Science用户

回答已采纳

发布于 2016-03-23 23:37:32

显而易见的答案是Netflix奖数据集,对它进行了大量的研究,而且大多数CF算法都知道其中的分数。

还有其他可用的数据集通常被用作基准:

  • 电影镜头数据集:用于基准CF算法的2,000万个评级数据集;
  • 杰斯特数据集:一个超过600万收视率的笑话推荐数据集;
  • 您可以在这个链接中找到更多的数据集。
票数 8
EN

Data Science用户

发布于 2017-11-03 17:58:37

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/10844

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档