文章/答案/技术大牛

发布

社区首页 >问答首页 >数据不一致

问数据不一致
EN

Data Science用户

提问于 2017-07-25 06:05:06

回答 1查看 237关注 0票数 -1

我有客户档案和共同基金的数据集，现在的问题是有大量的不同的共同基金可供使用，根据历史，我可以看到对于某些类型的客户档案，有20多个不同的基金被建议了？

现在我不知道我应该用哪种算法来为某些客户提供最推荐的资金？

machine-learning

predictive-modeling

recommender-system

回答 1

Data Science用户

回答已采纳

发布于 2017-07-25 07:06:03

我想你想要建立一个推荐引擎，它将根据客户的个人资料向客户推荐共同基金。推荐系统是一种特殊的机器学习类，它采用了监督/无监督的机器学习技术。

根据维基百科，

推荐系统或推荐系统(有时将" system“替换为平台或引擎等同义词)是信息过滤系统的子类，其目的是预测用户对项目的”评级“或”偏好“。

因此，从本质上讲，问题陈述中的项目是共同基金，您需要预测客户的偏好。较高的评级/偏好的共同基金，让我们称之为X的客户A将意味着X应该推荐给A。

现在，您如何对项目列表给予评级/偏好？推荐系统采用了以下几种方法：

基于流行度的方法
基于内容的方法
基于最近邻和矩阵分解的协同滤波方法
混合法

基于人气的方法-基于受欢迎度的方法将推荐项目，在你的情况下，共同基金，根据购买总数。它将把共同基金按过去的最大买入数排在最高位。顶部的项目将推荐给每个用户/客户端。

基于流行的方法的优点是它很容易实现。这种方法被用来列出电子商务网站中最受欢迎的项目--在线新闻(Google )。它可以使用上下文(例如，在一天中的这个时候最流行的产品)。它可以使用用户和项特性(例如，功能F1中最受欢迎的产品，在具有UF1功能的用户中最受欢迎的产品)。
基于流行的方法的缺点:没有个性化的推荐。每个人都被推荐使用相同的项目。

基于内容的方法-在基于内容的方法中，项目以及用户/客户端的特性被用来提供个性化的推荐。

根据维基百科，

基于内容的过滤方法基于对项的描述和用户首选项的配置文件。在基于内容的推荐系统中，关键字用于描述项目，并构建用户配置文件以指示用户喜欢的项目类型。换句话说，这些算法试图推荐类似于用户过去喜欢的项目。

因此，假设其中一个客户端具有特性UF1，UF2在过去购买了一个具有F1、F2和F3功能集的共同基金X。新的共同基金产品，比如Y和Z，只有在它们的功能与F1、F2和F3相匹配的情况下才会推荐给这个客户。它也被称为基于分类的方法，因为您正在将产品和用户的特性列表输入到分类器中，以预测应该推荐哪些项目。要构建基于内容的方法模型，可以使用机器学习模型，如朴素贝叶斯分类器或决策树。

基于内容的方法相对于基于流行的方法的优势在于它提供了个性化的推荐。
缺点:它不是可伸缩的。用户和产品的高质量信息难以收集。

协同过滤方法-

根据维基百科，

协同过滤方法是通过收集和分析大量的用户行为、活动或偏好信息，根据用户与其他用户的相似性来预测用户的喜好。

在不涉及技术术语的情况下，协作过滤方法有两种类型--基于用户的协作过滤和基于项的协作过滤。

在基于用户的协同过滤中，假设用户/客户端A购买了两个项目X和Y，而用户/客户端B购买了相同的项目X和Y，因此这两个用户根据他们的购买历史来看是相似的。现在，如果用户/客户B购买第三项Z，Z也将推荐给用户/客户端A。

在基于项目的协同过滤中，假设用户/客户端A购买了项目W、Y和Z。用户/客户端B购买W，Y用户/客户端C只购买Y。用户/客户端C将推荐给用户/客户端C？回答是项目W，因为项目W是用户/客户A和B与项目Y共同购买的。

这些技术属于最近邻协同过滤技术，因为我们试图通过确定用户或项的最近邻居来对其进行分类。使用一种名为kNN (k最近邻)的算法来完成任务.

还有另一种叫做矩阵分解的技术。

基于混合的方法-基于混合的方法，顾名思义，是基于内容的方法和协作过滤方法的结合。Netflix和Amazon主要使用它来提供最佳推荐。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/21668

复制

相似问题

问数据不一致
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问数据不一致EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问数据不一致
EN