文章/答案/技术大牛

发布

社区首页 >问答首页 >宏F1结果高于不平衡数据集的精度

问宏F1结果高于不平衡数据集的精度
EN

Data Science用户

提问于 2020-02-18 17:24:18

回答 1查看 1.3K关注 0票数 1

在一篇关于假新闻检测的研究论文中，作者收集了一个由16,817真文章和5,323假新闻组成的假新闻二进制数据集(假新闻与真实新闻)。

作者使用精确性、精确性、查全性和F1给出了结果，但没有具体说明他们在F1度量(macro、micro、weighted等)上应用哪种平均值。

以下是研究结果：

如果您注意到最后一个系统，精度值是0.689，F1值是0.717，这比精度要高。

因此，给出数据集的不平衡状态，作者是否可能使用F1度量中的类平均使用macro方法？

对我来说，这“不可能”发生，我认为他们可能使用了weighed F1评分。

f1score

machine-learning

class-imbalance

回答 1

Data Science用户

发布于 2020-02-18 17:41:59

他们计算了为二进制分类任务定义的“标准”F1评分：

precision = 0.656
recall = 0.792
f1 = 2 * (precision * recall) / (precision + recall)
f1

给出

0.7176132596685083

F1评分的其他版本用于多个类，因为您可以在“扩展到多类分类”下面看到这里：

F-评分也用于多个类别(多类分类)的分类问题的评价。在这种设置中，最终得分是通过微观平均(按班级频率偏差)或宏观平均(将所有类都视为同等重要)来获得的。对于宏观平均，申请人使用了两个不同的公式：(算术)类精度和回忆均值的F-得分或类F-分数的算术平均值，后者表现出更理想的特性。

或者，请参阅这里以了解F1评分及其参数描述的实现。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/68293

复制

相似问题

问宏F1结果高于不平衡数据集的精度
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问宏F1结果高于不平衡数据集的精度EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问宏F1结果高于不平衡数据集的精度
EN