我正在比较用于海上搜索和救援(SAR)目的的目标检测模型。从我使用的模型,我得到了最好的结果YOLOv3的改进版本的小对象检测和更快的RCNN。
对于YOLOv3,我得到了最好的mAP@50,但是为了更快的RCNN,我得到了更好的其他指标(精确性、回忆性、F1分数)。现在我想知道如何阅读它,在这种情况下哪种模式更好呢?

我想补充的是,数据集中只有两个类:小对象和大对象。我们之所以选择这个解决方案,是因为对象在类之间的区别对我们来说并不像检测任何人类起源的对象那么重要。
然而,小对象并不意味着小GT包围盒。这些物体的面积实际上很小--不到2平方米(例如人、浮标)。大型物体是指面积较大的物体(船只、船只、独木舟等)。
以下是每个类别的结果:

以及数据集中的两个样本图像(带有YOLOv3检测):


发布于 2020-07-19 18:53:36
用于对象检测的mAP是为所有类计算的AP的平均值。mAP@0.5表示它是在IOU阈值0.5处计算的mAP。
平均精度(AP)的一般定义是在查全率曲线下求出面积.
作为模型置信阈值的函数,绘制模型的精度和召回率的过程是精确召回曲线。
精确测量你的预测有多精确。也就是说,你的预测中正确的百分比。回忆衡量你有多好发现所有的积极因素。F1评分是查全率和召回率的HM (调和均值)。
现在就回答你的问题。
如何读取它,在这种情况下哪个模型更好?
相比,在所有3种度量指标上它都要好一些。
什么度量应该更重要?
一般来说,为了分析性能更好的模型,我建议您使用验证集(用于调优超参数的数据集)和测试集(用于评估经过充分训练的模型的性能)。
注: FP -假阳性FN -假阴性
验证集上的:
。
对模型进行相应的培训/调优。
测试集上的:
模型。
模型。
https://stackoverflow.com/questions/62973155
复制相似问题