首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >RetinaNet中的焦损

RetinaNet中的焦损
EN

Stack Overflow用户
提问于 2019-01-31 13:30:49
回答 1查看 1.1K关注 0票数 3

请简单地解释一下RetinaNet中的焦点损失是什么,从以下两个文件中可以看出金字塔网络用于目标检测,焦点丢失用于密集目标检测。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-03-01 04:59:44

焦点损失可以定义为(注:最初的论文描述了二元分类的损失,但在这里,我将其扩展到多类情况):

其中,K表示类数;yi =1,如果地面真相属于第I类,则为0;pi是第I类的预测概率;γ∈(0,+∞)是聚焦参数;αi∈[0,1]是第I类的加权参数。损失类似于分类交叉熵,如果γ=0αi=1的话,它们是等价的。那么,这两个附加参数的目的是什么呢?

正如最初的论文所指出的那样,类不平衡是一个很有问题的问题,在实践中限制了检测器的性能。这是因为图像中的大多数位置都是很容易被否定的(这意味着它们可以很容易地被检测器归类为背景),并且没有提供有用的学习信号;更糟糕的是,由于它们占了输入的很大一部分,它们可以压倒损失和计算的梯度,并导致退化模型。为了解决这个问题,焦损引入了聚焦参数γ来降低分配给容易分类的例子的损失。这种效果随着γ值的增加而增加,并使网络更加关注硬示例。

平衡参数α对于解决类不平衡也很有用。它可以通过逆类频率(或作为超参数)来设置,这样分配给背景类示例的损失可以向下加权。

注意,由于这两个参数相互作用,所以应该一起选择它们。一般来说,随着γ的增加,slightly11应该减少α。

这里有一篇文章详细解释了RetinaNet:https://blog.zenggyu.com/en/post/2018-12-05/retinanet-explained-and-demystified/

票数 8
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54461726

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档