我正在开发一个基于用户点击行为的个性化新闻推荐引擎。我的特性将是预定义的新闻类别(如政治、体育等)。
每当用户单击一篇文章时,我都会基于本文构建/更新用户配置文件,然后从文章池中推荐另一篇文章。
关于这个系统的评估,我需要一个包含二进制用户项交互(用户点击推荐文章与否)的数据集--我找不到适合这个特定上下文的数据集。我想做的是,对Movielens数据集进行二值化,然后计算精确性和召回率。
我在MovieLens数据集中实际上所做的事情如下:,如果一个项目的评等由一个用户,大于这个用户的平均评等,我给它分配一个二进制等级,否则为1,0。
这种方法对这类系统的评估是否正确?
发布于 2015-12-14 16:12:18
顺便说一句,开放源码中已经有一个推荐器可以这样做,并允许混合多个事件/操作/指示符,还可以使用内容相似性这里。它是基于预测It的框架,这是基于星火。
https://stackoverflow.com/questions/34259611
复制相似问题