我在任何地方都找不到这个问题的答案,所以我希望这里的人能帮助我,也希望其他有同样问题的人能帮我。
假设我有1000个阳性样本和1500个阴性样本。
现在,假设有950真阳性(阳性样本正确分类为阳性)和100假阳性(阴性样本错误分类为阳性)。
我应该使用这些原始数字来计算精度,还是应该考虑不同的组大小?
换句话说,我的精确性应该是:
TruePositive / (TruePositive + FalsePositive) = 950 / (950 + 100) = 90.476%
或应该是:
(TruePositive / 1000) / (TruePositive / 1000) + (FalsePositive / 1500) = 0.95 / (0.95 + 0.067) = 93.44%
在第一次计算中,我不考虑每组样本的数量而取原始数字,而在第二次计算中,我使用每一度量与其对应组的比例,以消除由于组大小不同而造成的偏差。
https://stackoverflow.com/questions/34375657
复制相似问题