文章/答案/技术大牛

发布

社区首页 >问答首页 >不同组大小的查准率和召回计算

问不同组大小的查准率和召回计算
EN

Stack Overflow用户

提问于 2015-12-19 21:36:54

回答 1查看 123关注 0票数 1

我在任何地方都找不到这个问题的答案，所以我希望这里的人能帮助我，也希望其他有同样问题的人能帮我。

假设我有1000个阳性样本和1500个阴性样本。

现在，假设有950真阳性(阳性样本正确分类为阳性)和100假阳性(阴性样本错误分类为阳性)。

我应该使用这些原始数字来计算精度，还是应该考虑不同的组大小？

换句话说，我的精确性应该是：

TruePositive / (TruePositive + FalsePositive) = 950 / (950 + 100) = 90.476%

或应该是：

(TruePositive / 1000) / (TruePositive / 1000) + (FalsePositive / 1500) = 0.95 / (0.95 + 0.067) = 93.44%

在第一次计算中，我不考虑每组样本的数量而取原始数字，而在第二次计算中，我使用每一度量与其对应组的比例，以消除由于组大小不同而造成的偏差。

precision-recall

machine-learning

nlp

information-retrieval

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-12-19 22:41:57

回答问题:在定义中，精度由第一个公式: TP/(TP+FP)计算。

然而，这并不意味着你必须使用这个公式，即精确测量。还有很多其他的衡量标准，看看这个wiki页面上的表格，并选择最适合您的任务。

例如，正似然比似乎与您的第二个公式最相似。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34375657

复制

相似问题

问不同组大小的查准率和召回计算
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不同组大小的查准率和召回计算EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不同组大小的查准率和召回计算
EN