我想测试一种新的协同过滤算法。一个典型的用例是根据类似于特定用户的用户偏好推荐电影。
研究人员经常使用哪些常用的基准数据集来测试他们的算法?我知道,在计算机视觉中,人们经常使用MNIST或CIFAR,但我还没有找到用于协作过滤的类似数据集。
发布于 2016-03-23 23:37:32
显而易见的答案是Netflix奖数据集,对它进行了大量的研究,而且大多数CF算法都知道其中的分数。
还有其他可用的数据集通常被用作基准:
发布于 2017-11-03 17:58:37
https://datascience.stackexchange.com/questions/10844
复制相似问题