文章/答案/技术大牛

发布

社区首页 >问答首页 >什么是弱监督学习(引导)？

问什么是弱监督学习(引导)？
EN

Stack Overflow用户

提问于 2013-09-22 14:21:41

回答 4查看 25.5K关注 0票数 29

我理解监督学习和非监督学习的区别：

监督学习是利用标记数据进行分类器教学的一种方法。

无监督学习允许分类器“自主学习”，例如使用聚类。

但是什么是“弱监督学习”呢？它如何分类它的例子？

machine-learning

classification

回答 4

Stack Overflow用户

回答已采纳

发布于 2013-09-22 17:02:21

更新答复

正如下面几条评论所提到的，情况并不像我在2013年最初写的那样简单。

人们普遍接受的观点是

弱监督-带噪声标签的监督(维基百科)
半监督-只有一部分培训数据有标签(维基百科)

还有一些分类更符合我最初的回答，例如，周志华2017年“弱监督学习”简介认为弱监管是一个总括术语。

不完全监督-只有一部分培训数据有标签(与上面相同)
不精确的监督-称为训练数据只带有粗粒度的标签。
不准确的监督--在给定的标签并不总是真实的情况下(上面的弱监督)。

原始答案

简而言之:在弱监督学习中，您使用的是有限数量的标记数据.。

如何选择此数据以及如何处理这些数据取决于方法。通常，您使用数量有限的数据，这些数据易于获取和/或产生真正的不同，然后学习其余的数据。我认为引导是一种可以用于弱监督学习的方法，但正如Ben下面的评论所示，这不是一个普遍接受的观点。

例如，有关引导/弱监督学习的概述，请参见克里斯·比曼2007年论文：

自举，也称为自我训练，是一种学习形式，旨在使用更少的训练例子，因此有时被称为弱监督。引导从几个训练示例开始，训练一个分类器，并使用这个分类器产生的潜在的积极例子进行再培训。随着训练样本集的增加，分类器得到改进，前提是没有太多的负面样本被错误地归类为正类，这可能导致性能的下降。

例如，在词性标注的情况下，一个人通常会训练一个HMM (或最大熵或其他什么)标记词，每个标签都带有词性。在弱监督标记的情况下，您可能只使用一个非常小的语料库，由1000多个单词组成。你得到一些标签，你用它标记一个1000字的语料库，你训练一个标记者，用它标记更大的语料库。显然，你必须比这更聪明，但这是一个好的开始。(有关引导标记程序的更高级示例，请参见本论文 )

注:弱监督学习也可以指带噪声标签的学习(这类标签可以但不一定是引导的结果)。

票数 30

Stack Overflow用户

发布于 2016-04-24 05:48:53

弱监管是带有噪声标签的监督。例如，引导，其中引导过程可能错误标签的一些例子。
远程监督是指不直接标注示例的训练信号；例如，从问答数据集中学习语义解析器。
Semi-supervised学习是指具有部分标记和部分未标记的数据集。
Full-supervised学习是指每个数据点都有基本的真理标签。

票数 30

Stack Overflow用户

发布于 2019-06-03 14:52:45

本文1界定了三种典型的弱监管类型：

不完全监督，其中只有一部分培训数据带有标签；(我认为这与半监督相同)
不精确监督，其中训练数据只给出粗粒度的标签；
和不准确的监督，在这里，给定的标签并不总是根据事实.

[ 1 ]周志华，弱监督学习简介，“国家科学评论”，第5卷，第1期，2018年1月，第44-53页，https://doi.org/10.1093/nsr/nwx106

票数 6

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/18944805

复制

相似问题

问什么是弱监督学习(引导)？
EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问什么是弱监督学习(引导)？EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问什么是弱监督学习(引导)？
EN