我在探索基于内容的算法,所以我了解到基于内容的算法是用来计算项目和用户之间的相似度的,就像"pandora“一样。所以我的要求是我有100的比例,例如用户可以喜欢40%的蔬菜和60%的非蔬菜,有喜欢/不喜欢的比例,项目也会有蔬菜,非蔬菜属性。是否可以计算用户偏好比例和项目的相似度,或者是否有符合我需求的算法或帮助我的文档?
提前感谢
发布于 2015-07-23 22:06:16
包括余弦相似度(https://en.wikipedia.org/wiki/Cosine_similarity)在内的许多标准相似度算法都是合适的。如果您有两个向量(即,一个用户的所有属性按某种顺序得分,然后另一个用户的所有属性按相同顺序得分),则可以对这些向量使用余弦相似度。如果你有用户A和B,属性是"veg“、"spicy”和"sweet",并且每个属性都有用户的分数,那么只需将它们插入到余弦相似性算法中。由于蔬菜和非蔬菜只加了100%,所以没有必要计算两者,因为与蔬菜相比,非蔬菜不会增加任何信息。
https://stackoverflow.com/questions/31585224
复制相似问题