基于用户评估的数据,它试图找到相似的用户。
当我有以下使用R的数据时,我如何找到相似的用户?
User2更像是user1。
如何计算?
> str(df)
'data.frame': 9 obs. of 3 variables:
$ user : chr "user1" "user1" "user1" "user2" ...
$ movie: chr "movie1" "movie2" "movie3" "movie1" ...
$ score: num 5 4 3 4 4 3 3 4 5

发布于 2020-10-15 01:10:46
也许你可以使用个体之间距离的概念(取自数据挖掘技术作为ML的第一步):
#Data
df <- data.frame(user=paste0('user',1:3),
movie1=c(5,4,3),
movie2=c(4,4,4),
movie3=c(3,3,5))
#Format
df2 <- df
rownames(df2) <- df2$user
df2$user <- NULL
#Compute distance
dist(df2)输出:
dist(df2)
user1 user2
user2 1.000000
user3 2.828427 2.236068根据之前的结果,user1和user2之间的距离较小(它们更近),因此它们可以更相似。我将把这作为一个选项留给您,因为其他数据挖掘方法可能更适合于理解您想要达到的目标。
https://stackoverflow.com/questions/64358187
复制相似问题