首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在Mahout中没有负偏好值的建议

在Mahout中没有负偏好值的建议
EN

Stack Overflow用户
提问于 2013-06-25 08:48:46
回答 2查看 852关注 0票数 0

我有一个问题,关于马赫特的偏好值的含义。在“行动中的马赫特”一书中说:

偏好值可以是任何东西,只要较大的值意味着更强的积极偏好。例如,这些值可能是1到5的等级,其中1表示用户无法忍受的项目,5表示收藏夹。

这是否意味着推荐人总是将较小的值解释为负面偏好(不喜欢)?

我正在尝试创建一个没有负面偏好的推荐。我的意思是我根本没有首选项,但是我可以根据不同的加权指标(点击/编辑的次数、编辑的数量、编辑的方式等等)来导出它们。但是,在我的实现中,当用户编辑了某个页面时,这并不意味着用户不喜欢该页面,而是在一定程度上喜欢它(正如我前面描述的那样,喜欢的频移)。

我试过只使用布尔偏好(likelehood和Tanimoto相似性),但它们的性能并不好,而且在大多数情况下,它们无法产生推荐(在moore中是50%)。

我想利用数字来获得偏好,这样推荐会更好,但我不确定如何。我尝试过将偏好值从上面的5导出到10,然后每个用户对人工项的偏好值为1(意思是不喜欢它)。然而,我认为这不是一个好方法,因为这意味着每个用户都不喜欢同一个项目。

有没有人更好地知道如何应用一些基于用户和基于项的算法,只有“正”(喜欢)偏好值?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-06-25 12:37:46

你应该试着:

  • 基于hadoop的隐式偏好ParallelALSFactorizationJob
  • 或隐式偏好ALSWRFactorizerSVDRecommender (不是基于hadoop的)(我认为这种非hadoop隐式偏好变量仅在mahout-0.8中可用),

在这些数字中,您分配给用户对某一项的偏好的数字表明了该关联有多强,而不是评级,因此它们都是积极的关联,只是具有不同的优势。通过这种方式,您可以对不同的交互进行建模,例如视图、编辑、单击等等。尽管分配给每个人的强度会因您的特定业务而有所不同。

这个演示文稿(链接)应该让你对正在发生的事情有一个大致的了解。另外,本文(链接)描述了分解器的隐式反馈变体(它们是相同的,其中之一就是用hadoop进行扩展)。

票数 1
EN

Stack Overflow用户

发布于 2013-06-25 12:34:21

如果你的意思是,你能得到合理的结果仅仅基于积极的行动,那么当然是的。这是常见的情况。偏好值的解释方式在很大程度上取决于您所使用的算法,但对于任何算法,我不认为用所有正值编码所有正操作都有任何问题。这是个简单的例子。"1“本质上并不是负面评价,不是。

但是,您关于相似性度量的观点与值无关。听起来你的数据很稀少。这是另外一个问题。

其余的我不太明白。您使用的值取决于您的域。我会使他们与他们的“力量”或价值成比例。例如,如果视频查看频率比视频共享高20倍,您可能会使视频共享的值比单击高20倍。这是个不错的开始。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/17292926

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档