首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >什么是弱监督学习(引导)?

什么是弱监督学习(引导)?
EN

Stack Overflow用户
提问于 2013-09-22 14:21:41
回答 4查看 25.5K关注 0票数 29

我理解监督学习和非监督学习的区别:

监督学习是利用标记数据进行分类器教学的一种方法。

无监督学习允许分类器“自主学习”,例如使用聚类。

但是什么是“弱监督学习”呢?它如何分类它的例子?

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2013-09-22 17:02:21

更新答复

正如下面几条评论所提到的,情况并不像我在2013年最初写的那样简单。

人们普遍接受的观点是

还有一些分类更符合我最初的回答,例如,周志华2017年“弱监督学习”简介认为弱监管是一个总括术语。

  • 不完全监督-只有一部分培训数据有标签(与上面相同)
  • 不精确的监督-称为训练数据只带有粗粒度的标签。
  • 不准确的监督--在给定的标签并不总是真实的情况下(上面的弱监督)。

原始答案

简而言之:在弱监督学习中,您使用的是有限数量的标记数据.

如何选择此数据以及如何处理这些数据取决于方法。通常,您使用数量有限的数据,这些数据易于获取和/或产生真正的不同,然后学习其余的数据。我认为引导是一种可以用于弱监督学习的方法,但正如Ben下面的评论所示,这不是一个普遍接受的观点。

例如,有关引导/弱监督学习的概述,请参见克里斯·比曼2007年论文

自举,也称为自我训练,是一种学习形式,旨在使用更少的训练例子,因此有时被称为弱监督。引导从几个训练示例开始,训练一个分类器,并使用这个分类器产生的潜在的积极例子进行再培训。随着训练样本集的增加,分类器得到改进,前提是没有太多的负面样本被错误地归类为正类,这可能导致性能的下降。

例如,在词性标注的情况下,一个人通常会训练一个HMM (或最大熵或其他什么)标记词,每个标签都带有词性。在弱监督标记的情况下,您可能只使用一个非常小的语料库,由1000多个单词组成。你得到一些标签,你用它标记一个1000字的语料库,你训练一个标记者,用它标记更大的语料库。显然,你必须比这更聪明,但这是一个好的开始。(有关引导标记程序的更高级示例,请参见本论文 )

注:弱监督学习也可以指带噪声标签的学习(这类标签可以但不一定是引导的结果)。

票数 30
EN

Stack Overflow用户

发布于 2016-04-24 05:48:53

  • 弱监管是带有噪声标签的监督。例如,引导,其中引导过程可能错误标签的一些例子。
  • 远程监督是指不直接标注示例的训练信号;例如,从问答数据集中学习语义解析器。
  • Semi-supervised学习是指具有部分标记和部分未标记的数据集。
  • Full-supervised学习是指每个数据点都有基本的真理标签。
票数 30
EN

Stack Overflow用户

发布于 2019-06-03 14:52:45

本文1界定了三种典型的弱监管类型:

  • 不完全监督,其中只有一部分培训数据带有标签;(我认为这与半监督相同)
  • 不精确监督,其中训练数据只给出粗粒度的标签;
  • 不准确的监督,在这里,给定的标签并不总是根据事实.

[ 1 ]周志华,弱监督学习简介,“国家科学评论”,第5卷,第1期,2018年1月,第44-53页,https://doi.org/10.1093/nsr/nwx106

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18944805

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档