有人能给我一个例子,说明每种方法的工作原理,以及它们的错误度量有何不同?谢谢!
发布于 2014-12-04 14:08:15
规范化贴现累积增益(NDCG)根据推荐实体的分级相关性来衡量推荐系统的性能。它从0.0到1.0不等,1.0表示实体的理想排名。这一指标通常用于信息检索和评价web搜索引擎的性能。
根均方误差(RMSE)可能是评价预测等级准确性最常用的指标。该系统为已知实际评级Rui的用户项对(u,i)的测试集T生成预测等级Rˆui。通常,Rui之所以为人所知,是因为它们隐藏在离线实验中,或者因为它们是通过用户研究或在线实验获得的。它在0.0到1.0之间变化,较低的值表示错误较少(因此“更好”)。
您更有可能看到包括RMSE在内的学术论文,虽然NDCG确实有它的位置,但您并不经常看到它,特别是当您正在检查具有强大的信息检索组件的推荐系统时。根均方误差并不是特定于应用程序的,因此在评估推荐系统的预测精度时,大多数学术文献都会包含这些误差。
这些信息是很容易通过Google访问的,所以在发布类似的问题之前,请在将来花点时间做一些研究。有大量的工作示例,公式在每个Wiki页面上都有清晰的描述,NDCG:DCG和RMSE:deviation。
https://stackoverflow.com/questions/24212843
复制相似问题