在我的数据集中,相同的用户对同一项进行了多次评级(尽管不同的评级)。因此,getRatings命令正在聚合分级。
如何在建立推荐系统的同时解决这个问题呢?
library(recommenderlab)
beer_beerid review_profilename review_overall
5441 Kadonny 3.0
5441 Kadonny 4.5
5441 Kadonny 4.0发布于 2017-03-14 07:50:00
查看一下duplicated,只需使用要检查的列。所以忽略这个测试的review_overall列..。
duplicated_ratings <- duplicated(my_rating_df[c('beer_beerid','review_profilename')])
single_rating <- my_rating_df[!duplicated_ratings,]如果您想要创建一个平均值,我建议使用dplyr包。
library(dplyr)
my_rating_df %>%
group_by(beer_beerid, review_profilename) %>%
summarise(average_rating=mean(review_overall)https://stackoverflow.com/questions/42779715
复制相似问题