我理解监督学习和非监督学习的区别:
监督学习是利用标记数据进行分类器教学的一种方法。
无监督学习允许分类器“自主学习”,例如使用聚类。
但是什么是“弱监督学习”呢?它如何分类它的例子?
发布于 2013-09-22 17:02:21
更新答复
正如下面几条评论所提到的,情况并不像我在2013年最初写的那样简单。
人们普遍接受的观点是
还有一些分类更符合我最初的回答,例如,周志华2017年“弱监督学习”简介认为弱监管是一个总括术语。
原始答案
简而言之:在弱监督学习中,您使用的是有限数量的标记数据.。
如何选择此数据以及如何处理这些数据取决于方法。通常,您使用数量有限的数据,这些数据易于获取和/或产生真正的不同,然后学习其余的数据。我认为引导是一种可以用于弱监督学习的方法,但正如Ben下面的评论所示,这不是一个普遍接受的观点。
例如,有关引导/弱监督学习的概述,请参见克里斯·比曼2007年论文:
自举,也称为自我训练,是一种学习形式,旨在使用更少的训练例子,因此有时被称为弱监督。引导从几个训练示例开始,训练一个分类器,并使用这个分类器产生的潜在的积极例子进行再培训。随着训练样本集的增加,分类器得到改进,前提是没有太多的负面样本被错误地归类为正类,这可能导致性能的下降。
例如,在词性标注的情况下,一个人通常会训练一个HMM (或最大熵或其他什么)标记词,每个标签都带有词性。在弱监督标记的情况下,您可能只使用一个非常小的语料库,由1000多个单词组成。你得到一些标签,你用它标记一个1000字的语料库,你训练一个标记者,用它标记更大的语料库。显然,你必须比这更聪明,但这是一个好的开始。(有关引导标记程序的更高级示例,请参见本论文 )
注:弱监督学习也可以指带噪声标签的学习(这类标签可以但不一定是引导的结果)。
发布于 2016-04-24 05:48:53
发布于 2019-06-03 14:52:45
本文1界定了三种典型的弱监管类型:
[ 1 ]周志华,弱监督学习简介,“国家科学评论”,第5卷,第1期,2018年1月,第44-53页,https://doi.org/10.1093/nsr/nwx106
https://stackoverflow.com/questions/18944805
复制相似问题