首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >神经网络:如何利用弱/无监督数据来改进有监督网络?

神经网络:如何利用弱/无监督数据来改进有监督网络?
EN

Data Science用户
提问于 2016-11-04 22:00:57
回答 1查看 108关注 0票数 2

让我们考虑一下,我们已经为某些任务建立了一个完全监督的神经网络,例如在各种场景中定位一个对象。正如您可以想象的那样,给数据贴上标签是很费时的:一个人必须手动地在图像中定位对象,然后在它周围画一个边框--一次一个。

假设我们有一个正常的卷积神经网络(CNN)来进行全员监督的定位,因此这样的情况如下:

代码语言:javascript
复制
          2D input image
                |
       convolutional-layer 1
                |
               ...
                |
       convolutional-layer N
                |
      ---flattened output---
                |                    
    fully-connected classifier
                |
           output layer

我们怎样才能使这种架构也能利用标签不高的数据呢?

不管我们是否采用滑动窗口方法,比如OverFeat或实际定位对象的概率分布:我们总是需要完全标记的训练数据。这是一个问题,因为标签数据的全面监督真的很费时.因此,完全标记的数据集非常罕见。

与此形成对照的是,通常存在大量弱标记或未标记的数据。在我看来,有很大的潜力,在弱标签/无标签的数据,因为它的巨大的可用性。问题是,利用这一潜力,而不必手动标记每一个样本。

尽管如此,我的问题是:如何利用弱标记数据集(即“对象”与“无对象”)或完全无标记的数据集来提高像上述CNN那样的全监督体系结构的健壮性?

是否有可能将有监督的方法与无监督的方法混为一谈?就像允许一个完全监督的体系结构以某种方式利用标签弱的数据进行培训一样?

EN

回答 1

Data Science用户

发布于 2022-01-01 09:03:58

你会发现半监督的目标检测算法和弱监督的目标检测。半监督目标检测使用监督学习术语(手工标记数据)和半监督学习术语(未标记数据)。弱监督的目标检测使用不完全、不准确或部分的粗粒度数据.

对于被弱监督的目标检测,我推荐这两个调查。https://arxiv.org/abs/2104.07918

对于半监督的目标检测,我不知道直接调查。所以我推荐两份文件。

在“半监督学习”中,大多数采用了“伪标签”中的“自我训练”方案。因此,我建议对半监督学习进行调查。https://link.springer.com/article/10.1007/s10994-019-05855-6

  • 半监督学习研究综述(“机器学习”,2019年)
票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/14924

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档