我注意到Netflix,我认为它曾经使用五星级的评分标准来评价内容,并在相同的范围内给出未分级内容的预测评分,现在它只是有基本的“喜欢/不喜欢”按钮。像潘多拉和Spotify这样的音乐流媒体服务似乎采用了同样的方法。我的问题是,在产生最好的建议时,是什么使二进制响应优于likert类型的规模?
这是否与算法的性质有关(例如,当可能的反应较少时,分类更准确)?或者,这一优势更多地与人类心理有关(更容易让用户在喜欢/不喜欢,而不是爱/喜欢/中性/不喜欢/恨)之间做出选择?
发布于 2020-03-05 14:51:18
来自业务内部的这篇文章从业务角度回答了您的问题。
他们提到,最初的问题是Netflix使用五星级评级的方式在业内是不标准的:
Netflix的卡梅隆·约翰逊( Cameron Johnson )负责监管这一转变。他对“商业内幕”( Business In内幕)表示,这一切都源于这样一种认识,即Netflix一直使用的明星收视率与其他互联网上的收视率不同,但用户并不清楚这种区别。
而给用户的评分方式也使他们不愿做出贡献。他们的解决方案是拇指向上/拇指向下的方法,因为用户更清楚地知道他们在训练一种算法:
因此,在寻找替代品时,Netflix希望确保这一点是明确的。约翰逊说,这就是Netflix选择“大拇指上下”的原因,人们普遍认为这意味着你在训练一种算法来知道自己喜欢什么。
我怀疑有更多的想法,也许二进制数据只是简单的“足够好”。
挖掘海量数据集的本章在评级与布尔实用程序矩阵方面有一些有趣的考虑。
见第339页:
如果效用矩阵不是布尔型的,例如等级1-5,那么我们可以用效用值来加权表示项目配置文件的向量。通过减去用户的平均值来规范实用程序是有意义的。
特别是在处理评等矩阵时,需要注意不同的用户可能对评级有不同的理解,因此您很可能在计算建议之前将基准表规范化,而对于二进制数据则不需要这样做。
https://datascience.stackexchange.com/questions/33340
复制相似问题