让我们考虑一下,我们已经为某些任务建立了一个完全监督的神经网络,例如在各种场景中定位一个对象。正如您可以想象的那样,给数据贴上标签是很费时的:一个人必须手动地在图像中定位对象,然后在它周围画一个边框--一次一个。
假设我们有一个正常的卷积神经网络(CNN)来进行全员监督的定位,因此这样的情况如下:
2D input image
|
convolutional-layer 1
|
...
|
convolutional-layer N
|
---flattened output---
|
fully-connected classifier
|
output layer我们怎样才能使这种架构也能利用标签不高的数据呢?
不管我们是否采用滑动窗口方法,比如OverFeat或实际定位对象的概率分布:我们总是需要完全标记的训练数据。这是一个问题,因为标签数据的全面监督真的很费时.因此,完全标记的数据集非常罕见。
与此形成对照的是,通常存在大量弱标记或未标记的数据。在我看来,有很大的潜力,在弱标签/无标签的数据,因为它的巨大的可用性。问题是,利用这一潜力,而不必手动标记每一个样本。
尽管如此,我的问题是:如何利用弱标记数据集(即“对象”与“无对象”)或完全无标记的数据集来提高像上述CNN那样的全监督体系结构的健壮性?
是否有可能将有监督的方法与无监督的方法混为一谈?就像允许一个完全监督的体系结构以某种方式利用标签弱的数据进行培训一样?
发布于 2022-01-01 09:03:58
你会发现半监督的目标检测算法和弱监督的目标检测。半监督目标检测使用监督学习术语(手工标记数据)和半监督学习术语(未标记数据)。弱监督的目标检测使用不完全、不准确或部分的粗粒度数据.
对于被弱监督的目标检测,我推荐这两个调查。https://arxiv.org/abs/2104.07918
对于半监督的目标检测,我不知道直接调查。所以我推荐两份文件。
在“半监督学习”中,大多数采用了“伪标签”中的“自我训练”方案。因此,我建议对半监督学习进行调查。https://link.springer.com/article/10.1007/s10994-019-05855-6
https://datascience.stackexchange.com/questions/14924
复制相似问题