这些天我正在使用python的pandas和scikit-learn库学习统计学习,它们对我来说是非常棒的工具。
当然,我可以学习分类、回归和聚类的方法。
但是,当我想要建立一个推荐模型时,我找不到如何开始使用它们的方法。例如,如果我有一个客户的购买数据集,其中包含日期、产品名称、产品制造商、价格、订购设备等。
推荐的问题类型是什么?分类、回归或其他什么?
事实上,当有人必须解决这个问题时,我可以发现有一些非常著名的算法,比如协同过滤。
如果是这样,我可以使用scikit-learn来使用这些算法吗?或者我应该学习另一个M.L库?
问候
发布于 2015-11-10 22:32:56
Scikit-learn不提供任何推荐系统工具。你可以看看mahout,它提供了非常容易启动的命题或spark。
然而,在机器学习中推荐本身就是一个问题。例如,如果你试图预测用户对一部电影的评分,它可以是回归,或者如果你想知道用户是否喜欢这部电影,它可以是回归(二元选择)。重要的是,推荐使用的是专门针对这个问题的工具和算法,比如基于项目或基于内容的推荐。这些概念实际上很容易理解,你自己实现一个小小的推荐引擎可能是最好的。
我建议你读这本书,这本书很好地介绍了推荐概念
发布于 2016-01-12 14:29:02
Crab怎么样,它是一个https://github.com/python-recsys/crab框架,用于构建与科学Python包(numpy,scipy,matplotlib)集成的推荐引擎。
我没有使用过这个框架,只是找到了它。而且似乎只有0.1版,而Crab已经多年没有更新过了。因此,我怀疑它是否有很好的记录。无论如何,如果您决定尝试Crab,请在此之后给我们反馈:)
https://stackoverflow.com/questions/33623144
复制相似问题