基于内容的过滤(CBF):基于产品/项目属性的。比如说,user_1在过去已经为其中的一些项目下过订单(或喜欢)。现在,我们需要识别这些订购商品的相关特性,并将其与其他项目进行比较,以推荐任何新的项目。基于特征集的相似项查找的著名模型之一是随机森林或决策树。
协作过滤():它使用用户行为。比如说,user_1在过去已经为其中的一些项目下过订单(或喜欢)。现在我们发现了类似的用户。过去订购/喜欢相同商品的用户可以被视为类似的用户。现在,我们可以根据分数推荐一些由类似用户订购的商品。寻找相似用户的著名模型之一是KNN。
问题:说我必须找到类似的用户,而不是基于他们在CBF中的行为(就像我提到的那样),而是基于一些用户配置文件特征,比如国籍/身高/体重/语言/薪水等等,是基于CBF还是CLF?
第二个相关的疑问,我有两个CBF或CLF将不会工作的新用户在系统中,因为他没有做任何活动的系统。是这样吗?同样的情况是,当系统是新的或推出,因为我们将没有太多的数据在这里?
发布于 2019-07-30 05:37:30
您可以将基于内容的方法视为回归问题,其中将x_i作为数据点,并将其对应的y_i作为用户给予的评级。您正确地说明了CLF,它使用一个用户项矩阵来创建项项或用户用户矩阵,然后根据这些矩阵推荐产品/项。
但是在基于内容的方面,您需要构建一个对应于每个用户的向量。例如,我们希望为netflix用户创建一个向量。这个向量可以包括这个用户看过多少部电影,他/她喜欢什么电影,他(她)是一个关键的用户,等等,你提到的一些特征,比如他的平均工资和其他的,这个向量将有一个y_i,它将得到评分。这类推荐系统被称为基于内容的推荐系统,这回答了您的第一个问题。
接下来是你的第二个问题,当一个新的用户/项目出现在图片中时,如何向该用户推荐项目。这个问题被称为冷启动问题。在这种情况下,您可以使用该用户的地理位置,选择他的国家人民所关注的顶级项目,并在此基础上提出建议。一旦他开始对这些顶级项目进行评级,那么您的CLF和基于内容的产品就可以正常工作了。
https://stackoverflow.com/questions/56204583
复制相似问题