作为生成Pearson Correlation Coefficient的计算的一部分,将执行以下计算:

在第二个公式中:p_a,i是用户a将给项目i的预测评级,n是与之比较的相似用户的数量,ru,i是用户u对项目i的评级。
如果用户u未对此项目进行评分,将使用什么值?我是不是误解了什么?
发布于 2011-06-08 01:16:54
根据链接,算法步骤1中的早期计算是针对一组项目进行的,索引为1到m,其中m是公共项目的总数。
该算法的步骤3指定:“为了找到针对特定项目的特定用户的评分预测,首先选择相对于已经对所讨论的中的项目进行评分的当前用户具有最高加权相似度分数的多个用户。”
这些计算仅在不同用户评等项集合的交集上执行。当用户未对项目进行评分时,将不会执行任何计算。
发布于 2012-10-25 03:53:17
只有当两个用户都对一部电影进行了评分时,计算结果才有意义。线性回归可以可视化为一个method of finding a straight line through a two-dimensional graph,其中一个变量绘制在X轴上,另一个变量绘制在Y轴上。每个评级组合都表示为欧几里得平面u1_rating,u2_rating上的一个点。由于您不能绘制只有一个维度的点,因此您必须丢弃这些情况。
https://stackoverflow.com/questions/6268956
复制相似问题