我知道f1分数,它使用精确度和召回率。但是,mean f1 score中的“mean”是什么?当我们使用它的时候,如何计算“均值”?编辑以明确解释我的问题:我知道f1分数是准确率和召回率的调和平均值。并且在计算f1得分时,需要多个分类结果来计算准确率和召回率。然后我们把它放到列联表中,这样我们就可以计算f1分数了。
现在,这是我与“平均”f1分数混淆的点。我们从列联表中计算f1得分,但是什么是“均值
我正在尝试在PyTorch中实现宏度量分数(F- F1 ),而不是使用已经广泛使用的<code>C0</code>来直接在图形处理器上计算度量。据我所知,为了计算宏F1分数,我需要计算所有标签的灵敏度和精度的F1分数,然后取所有这些的平均值。在训练时,我计算每一批的度量,并将所有度量的平均值作为最终分数。问题是,当我将我的自定义F1分数与sklearn的宏观F1分数<