我有客户档案和共同基金的数据集,现在的问题是有大量的不同的共同基金可供使用,根据历史,我可以看到对于某些类型的客户档案,有20多个不同的基金被建议了?
现在我不知道我应该用哪种算法来为某些客户提供最推荐的资金?
发布于 2017-07-25 07:06:03
我想你想要建立一个推荐引擎,它将根据客户的个人资料向客户推荐共同基金。推荐系统是一种特殊的机器学习类,它采用了监督/无监督的机器学习技术。
根据维基百科,
推荐系统或推荐系统(有时将" system“替换为平台或引擎等同义词)是信息过滤系统的子类,其目的是预测用户对项目的”评级“或”偏好“。
因此,从本质上讲,问题陈述中的项目是共同基金,您需要预测客户的偏好。较高的评级/偏好的共同基金,让我们称之为X的客户A将意味着X应该推荐给A。
现在,您如何对项目列表给予评级/偏好?推荐系统采用了以下几种方法:
基于人气的方法-基于受欢迎度的方法将推荐项目,在你的情况下,共同基金,根据购买总数。它将把共同基金按过去的最大买入数排在最高位。顶部的项目将推荐给每个用户/客户端。
基于内容的方法-在基于内容的方法中,项目以及用户/客户端的特性被用来提供个性化的推荐。
根据维基百科,
基于内容的过滤方法基于对项的描述和用户首选项的配置文件。在基于内容的推荐系统中,关键字用于描述项目,并构建用户配置文件以指示用户喜欢的项目类型。换句话说,这些算法试图推荐类似于用户过去喜欢的项目。
因此,假设其中一个客户端具有特性UF1,UF2在过去购买了一个具有F1、F2和F3功能集的共同基金X。新的共同基金产品,比如Y和Z,只有在它们的功能与F1、F2和F3相匹配的情况下才会推荐给这个客户。它也被称为基于分类的方法,因为您正在将产品和用户的特性列表输入到分类器中,以预测应该推荐哪些项目。要构建基于内容的方法模型,可以使用机器学习模型,如朴素贝叶斯分类器或决策树。
协同过滤方法-
根据维基百科,
协同过滤方法是通过收集和分析大量的用户行为、活动或偏好信息,根据用户与其他用户的相似性来预测用户的喜好。
在不涉及技术术语的情况下,协作过滤方法有两种类型--基于用户的协作过滤和基于项的协作过滤。
在基于用户的协同过滤中,假设用户/客户端A购买了两个项目X和Y,而用户/客户端B购买了相同的项目X和Y,因此这两个用户根据他们的购买历史来看是相似的。现在,如果用户/客户B购买第三项Z,Z也将推荐给用户/客户端A。
在基于项目的协同过滤中,假设用户/客户端A购买了项目W、Y和Z。用户/客户端B购买W,Y用户/客户端C只购买Y。用户/客户端C将推荐给用户/客户端C?回答是项目W,因为项目W是用户/客户A和B与项目Y共同购买的。
这些技术属于最近邻协同过滤技术,因为我们试图通过确定用户或项的最近邻居来对其进行分类。使用一种名为kNN (k最近邻)的算法来完成任务.
还有另一种叫做矩阵分解的技术。
基于混合的方法-基于混合的方法,顾名思义,是基于内容的方法和协作过滤方法的结合。Netflix和Amazon主要使用它来提供最佳推荐。
https://datascience.stackexchange.com/questions/21668
复制相似问题