我正在阅读分类器,特别是多类分类器。我的问题是,当我用查准率和查全率来评价分类器时,我不明白假阳性和假阴性在多类分类器评估中的意义。
例如,当我对文档进行分类(其实际类别为C1)时,分类器将其分类为C2。那么,我应该在C2增加假阳性,在C1增加假阴性吗?(因为真正的答案是C1。)
发布于 2017-02-02 22:09:44
因为你给出的例子是两个类问题,所以我在你的例子中解释假阳性和假阴性。
在2类情况下,混淆矩阵通常如下所示:
| Declare C-1 | Declare C-2 |
|Is C-1| TP | FN |
|Is C-2| FP | TN |我所用的符号指的是:
从原始数据中,表中的值通常是测试数据上每一次发生的计数。由此,我们可以相应地计算精度、召回和其他值。
例如,您有一个表如下所示。
| Declare C-1 | Declare C-2 |
|Is C-1| 12 | 6 |
|Is C-2| 8 | 11 |上表表示以下信息:
C类-1:
Precision = 12 / (12 + 8)
Recall = 12 / (12 + 6)C类-2:
Precision = 11 / (11 + 6)
Recall = 11 / (11 + 8)例如,当我对文档进行分类(它的实际类别为C1)时,分类器将其分类为C2。那么,我应该在C2增加假阳性,在C1增加假阴性吗?(因为真正的答案是C1。)
您应该增加与Declare C-2和Is C-1相关联的混淆矩阵的单元格值的计数,这在下面用*表示。
| Declare C-1 | Declare C-2 |
|Is C-1| 0 | 0* |
|Is C-2| 0 | 0 |发布于 2019-03-24 13:02:57
用一行回答-是的,这一错误分类的影响将增加对C2的假阳性,而增加的假阴性对C1将下降。因此,C-2的精度会下降,C-1的召回率会下降.
在stats.stackexchange.com上也有一个类似的问题,它也有详细的答案:
https://stackoverflow.com/questions/41845152
复制相似问题