首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >二值化评等- MovieLens数据集

二值化评等- MovieLens数据集
EN

Stack Overflow用户
提问于 2015-12-14 04:08:38
回答 1查看 408关注 0票数 1

我正在开发一个基于用户点击行为的个性化新闻推荐引擎。我的特性将是预定义的新闻类别(如政治、体育等)。

每当用户单击一篇文章时,我都会基于本文构建/更新用户配置文件,然后从文章池中推荐另一篇文章。

关于这个系统的评估,我需要一个包含二进制用户项交互(用户点击推荐文章与否)的数据集--我找不到适合这个特定上下文的数据集。我想做的是,对Movielens数据集进行二值化,然后计算精确性和召回率。

我在MovieLens数据集中实际上所做的事情如下:,如果一个项目的评等由一个用户,大于这个用户的平均评等,我给它分配一个二进制等级,否则为1,0。

这种方法对这类系统的评估是否正确?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-12-14 16:12:18

  1. 二值化没有什么区别。精确性和回忆性是相对的,所以你只需要有人给你打分。对于测试目的来说,“好”评级的评估是毫无意义的。
  2. epinions有两个数据集,一个用于评级,另一个用于信任。
  3. 对一些建议使用MAP@k平均精度。这将考虑到一组建议的排名,这是毫无疑问的,它们将如何使用。

顺便说一句,开放源码中已经有一个推荐器可以这样做,并允许混合多个事件/操作/指示符,还可以使用内容相似性这里。它是基于预测It的框架,这是基于星火。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34259611

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档