首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于内容的Mahout推荐

基于内容的Mahout推荐
EN

Data Science用户
提问于 2015-11-18 05:47:48
回答 1查看 738关注 0票数 3

使用Mahout可以得到类似产品的推荐吗?

例:

我有一组具有以下属性的电影数据

Movie_name,Actor_1,Actor_2,Actress_1,Actress_2,导演,主题,语言

现在给出了一个Movie_name,系统应该根据属性推荐前3部类似的电影。

这能用Mahout来完成吗。如果是,怎么做?

EN

回答 1

Data Science用户

发布于 2015-12-21 21:46:56

通常,这是使用spark-rowsimilarity算法完成的--这是一种基于内容的推荐。然而,实际的过程是相当简单的。以下是几个步骤:

  1. 对于每部电影,将分类变量转换为列。让我们说,actor_1有布拉德皮特,丹尼尔克雷格和文迪塞尔不同的电影。这将成为三列,其中1表示哪些电影有每个演员。你的电影矩阵看起来像:电影名称,Has_Brad_Pitt,Has_Daniel_Craig,Has_Vin_Diesel,.军情-6,1,0,0,.Fast&Furios,0,0,1,…皇家赌场0,1,0.
  2. 现在,为了找到电影的相似性分数,你只需要计算两个向量的交叉乘积。价值越高,它们就越相似。

这可以由spark-rowsimilarity算法一次完成。您可能需要在编码分类变量方面做一些工作。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/8881

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档