文章/答案/技术大牛

发布

社区首页 >问答首页 >用于Movielens/Netflix类型数据集的SVD的基本伪代码

问用于Movielens/Netflix类型数据集的SVD的基本伪代码
EN

Stack Overflow用户

提问于 2011-03-14 09:19:03

回答 2查看 3.3K关注 0票数 4

我正在努力弄清楚如何开始使用奇异值分解与MovieLens/Netflix类型的数据集进行评级预测。我非常感谢任何简单的python/java示例，或者相关过程的基本伪代码。有许多论文/帖子总结了整个概念，但我不确定如何开始实现它，即使使用了许多建议的库。

据我所知，我需要按如下方式转换我的初始数据集：

初始数据集：

    user    movie   rating
    1       43      3
    1       57      2
    2       219     4

需要旋转到以下位置：

user        1   2
movie   43  3   0
        57  2   0
        219 0   4

在这一点上，我是否只需要将这个Matrix注入到可用库提供的SVD算法中，然后(以某种方式)提取结果，或者我还需要做更多的工作？

下面是我读过的一些信息：

http://www.netflixprize.com/community/viewtopic.php?id=1043

http://sifter.org/~simon/journal/20061211.html

http://www.slideshare.net/NYCPredictiveAnalytics/building-a-recommendation-engine-an-example-of-a-product-recommendation-engine

http://www.slideshare.net/bmabey/svd-and-the-netflix-dataset-presentation

。。和其他一些论文

一些库：

LingPipe(java)

Jama(java)

Pyrsvd(python)

任何提示都将受到赞赏，特别是在基本数据集上。非常感谢，奥利

netflix

collaborative-filtering

svd

recommendation-engine

prediction

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-03-15 17:31:56

请参阅Apache Mahout中的SVDRecommender。关于输入格式的问题完全取决于您使用的是什么库或代码。没有一个标准。在某种程度上，是的，代码将在内部构造某种类型的矩阵。对于Mahout，当作为文件提供时，所有推荐器的输入都是一个CSV文件，其中包含像userID,itemID,rating这样的行。

票数 4

Stack Overflow用户

发布于 2011-03-14 12:14:17

数据集： http://www.grouplens.org/node/73

SVD：如果你不懂怎么做，为什么不直接用SAGE来做呢？Wolfram alpha或http://www.bluebit.gr/matrix-calculator/会为你分解矩阵，或者它在维基百科上。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/5293802

复制

相似问题

问用于Movielens/Netflix类型数据集的SVD的基本伪代码
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于Movielens/Netflix类型数据集的SVD的基本伪代码EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于Movielens/Netflix类型数据集的SVD的基本伪代码
EN