首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何比较不同性能的建议模型?

如何比较不同性能的建议模型?
EN

Data Science用户
提问于 2021-06-03 01:46:07
回答 2查看 47关注 0票数 0

我有4类二进制分类模型。该模型可以识别特定学生适合的班级。

例如,我们有user 1和4个类的推荐模型。

模型确定了这个用户希望如何对待它的类。

通过阅读user 1的S个人资料(特写),模型A,B,C,D预测每个类别的适应度。二元分类阈值均为50%。

  • model A:77%,真实值
  • model B:65%,真实
  • model C:33%,假
  • model D:88%,真实

在此基础上,系统将类A, B, and C推荐给user 1

然而,模型的性能各不相同。每种模型都有不同的F1评分,例如model A:77%,model B:64%,model C:81%,model D:55%。

如何根据模型的F1评分,合理地度量每个推荐分数?

I also had thought that some recommender system might works, however recommendation algorithms were limit to utilize user's profile.

EN

回答 2

Data Science用户

回答已采纳

发布于 2021-06-04 02:50:43

我搜集了一些关于这个问题的资料。就像这个叫做,Multilabel Classification的问题。与多类分类不同,多标签分类对包括both 1s'all zeros在内的标签进行分类。

您可以从sklearn:https://scikit-learn.org/stable/modules/multiclass.html中引用这些想法。

票数 0
EN

Data Science用户

发布于 2021-06-03 07:29:49

,为什么要比较它们呢?

这四种模式正在解决不同的问题。因此,似乎不应该将这些模型与自身进行比较。

例如,如果您有3个不同的模型来对A类进行分类,那么您可以比较这些模型,因为它们都试图解决相同的问题。

比较模型A、B、C和D是很困难的,因为它们有不同的训练样本,而且从本质上讲,情况可能比较困难。例如,假设A班是“初学者的英语”,B班是“高级数据科学”,那么学生的国籍也许有助于预测A班,但学生过去的课程对B的预测是必要的,所以,也许A的分数>90%很容易,因为你掌握了所有的信息,但是B的分数超过90%是非常困难的。最后,如果model_A的得分为87.32%,model_B的得分为84.15%,那么谁认为model_A更好呢?我们不能这样做,因为他们解决的问题是不同的。

另一方面,如果您有解决相同问题的model_A1、model_A2和model_A3,则可以将它们与相同的测试集进行比较。

单问题

另一种看待你的问题的方法,是作为一个单一的问题。

虽然您有像model_A、model_B、model_C和model_D这样的小模型,但是它们可以组合成一个模型。

您可以获取每个模型的结果并创建一个最终的输出向量(例如[1,1,0,1]),这意味着推荐A、B和D。

然后使用这个结果给出整个系统的分数。

您仍然可以使用个人分数来查看微调的位置,但也许需要报告整个系统的得分。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/95205

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档