文章/答案/技术大牛

发布

社区首页 >问答首页 >基于内容的Mahout推荐

问基于内容的Mahout推荐
EN

Data Science用户

提问于 2015-11-18 05:47:48

回答 1查看 738关注 0票数 3

使用Mahout可以得到类似产品的推荐吗？

例：

我有一组具有以下属性的电影数据

Movie_name，Actor_1，Actor_2，Actress_1，Actress_2，导演，主题，语言

现在给出了一个Movie_name，系统应该根据属性推荐前3部类似的电影。

这能用Mahout来完成吗。如果是，怎么做？

python

recommender-system

apache-mahout

回答 1

Data Science用户

发布于 2015-12-21 21:46:56

通常，这是使用spark-rowsimilarity算法完成的--这是一种基于内容的推荐。然而，实际的过程是相当简单的。以下是几个步骤：

对于每部电影，将分类变量转换为列。让我们说，actor_1有布拉德皮特，丹尼尔克雷格和文迪塞尔不同的电影。这将成为三列，其中1表示哪些电影有每个演员。你的电影矩阵看起来像:电影名称，Has_Brad_Pitt，Has_Daniel_Craig，Has_Vin_Diesel，.军情-6，1，0，0，.Fast&Furios，0，0，1，…皇家赌场0，1，0.
现在，为了找到电影的相似性分数，你只需要计算两个向量的交叉乘积。价值越高，它们就越相似。

这可以由spark-rowsimilarity算法一次完成。您可能需要在编码分类变量方面做一些工作。

票数 2

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/8881

复制

相似问题

问基于内容的Mahout推荐
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于内容的Mahout推荐EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于内容的Mahout推荐
EN