请简单地解释一下RetinaNet中的焦点损失是什么,从以下两个文件中可以看出金字塔网络用于目标检测,焦点丢失用于密集目标检测。
发布于 2019-03-01 04:59:44
焦点损失可以定义为(注:最初的论文描述了二元分类的损失,但在这里,我将其扩展到多类情况):

其中,K表示类数;yi =1,如果地面真相属于第I类,则为0;pi是第I类的预测概率;γ∈(0,+∞)是聚焦参数;αi∈[0,1]是第I类的加权参数。损失类似于分类交叉熵,如果γ=0和αi=1的话,它们是等价的。那么,这两个附加参数的目的是什么呢?
正如最初的论文所指出的那样,类不平衡是一个很有问题的问题,在实践中限制了检测器的性能。这是因为图像中的大多数位置都是很容易被否定的(这意味着它们可以很容易地被检测器归类为背景),并且没有提供有用的学习信号;更糟糕的是,由于它们占了输入的很大一部分,它们可以压倒损失和计算的梯度,并导致退化模型。为了解决这个问题,焦损引入了聚焦参数γ来降低分配给容易分类的例子的损失。这种效果随着γ值的增加而增加,并使网络更加关注硬示例。
平衡参数α对于解决类不平衡也很有用。它可以通过逆类频率(或作为超参数)来设置,这样分配给背景类示例的损失可以向下加权。
注意,由于这两个参数相互作用,所以应该一起选择它们。一般来说,随着γ的增加,slightly11应该减少α。
这里有一篇文章详细解释了RetinaNet:https://blog.zenggyu.com/en/post/2018-12-05/retinanet-explained-and-demystified/
https://stackoverflow.com/questions/54461726
复制相似问题