我正在考虑使用PredictionIO来构建一个音乐推荐系统。
但是,在用户-项交互中,只支持以下操作:喜欢、不喜欢、查看、转换和比率(比例尺1-5)。
我现有的数据只包含视图(用户听歌曲)。
如何将数据转换为PredictionIO输入?我可以拥有同一用户项的多个视图记录(更多的视图=更多的权重),或者PredictionIO会根据时间戳查看最新的视图记录吗?
发布于 2014-08-21 14:28:22
我只使用Mahout,因此不知道PredictionIO如何将您的数据转换为输入和算法选择。
对于Mahout,您可以使用基于项的推荐器,使用布尔输入,并输入您的“侦听”作为值为1的动作和相似度度量SIMILARITY_LOGLIKELIHOOD。不管怎么说,LLR忽略了重量。权重用于试图预测用户评级的旧式推荐人。现在大多数人更感兴趣的是排名更好,上面的配置会给你最好的结果。
发布于 2014-09-02 10:33:08
只是为了完整性,正如在PredictionIO用户组中回答的那样
在当前版本0.7中,内置的algos不会聚合多个视图操作,因此更多的视图操作并不意味着更大的权重。您可以自定义算法来处理这个问题。
如果您有多个U2I操作(例如,查看、类似、比率),则可以定义冲突解决标准(例如,最新的、最高的)。但在您的情况下,使用单个操作(即用户侦听歌曲),多个“视图”将等同于单个“视图”。
下一个版本的PredictionIO将更好地支持自定义算法和引擎(例如,音乐推荐)。
https://stackoverflow.com/questions/25403275
复制相似问题