文章/答案/技术大牛

发布

社区首页 >问答首页 >监督学习和标签

问监督学习和标签
EN

Data Science用户

提问于 2016-01-01 08:11:03

回答 2查看 7.9K关注 0票数 5

在这 wiki页面中，我看到了以下短语。

如果没有标记数据，则不可能进行有监督的学习，并且需要进行无监督的学习。

我不明白为什么不可能有监督学习？

感谢任何帮助解决这一歧义。

machine-learning

supervised-learning

unsupervised-learning

回答 2

Data Science用户

回答已采纳

发布于 2016-01-01 08:54:20

监督学习和非监督学习的主要区别如下：

在监督学习中，您有一组标记的数据，这意味着您有输入和输出的值。你试图通过机器学习找到它们之间的真正关系，我们通常称之为数学模型。机器学习中有许多不同的算法，这些算法允许您获得数据的模型。您所寻求的目标，以及如何使用机器学习，是预测输出给定一个新的输入，一旦你知道模型。

在无监督的学习中，你没有标签的数据。你可以说你有输入，但没有输出。目的是在你的数据中找到某种模式。您可以找到您认为属于同一个组或输出的组或群集。在这里，您还必须获得一个模型。再一次，你所寻求的目标是能够预测给定一个新输入的输出。

最后，回到你的问题，如果你没有标签，你不能使用监督学习，你必须使用无监督学习。

票数 5

Data Science用户

发布于 2018-07-18 03:11:48

那句话很有误导性。这里有一个更好的方法来看待它：

一个问题是有监督的还是没有监督的，取决于你想要解决的问题的性质。在一个有监督的学习问题中，有一些你希望算法预测的基本真理。基本真理可以是离散的标签(分类)，也可以是连续域的值(回归)。另一方面，一个没有监督的学习问题并不试图“预测”某种标签或价值。相反，它试图学习数据的更好的表示或结构。聚类和降维都是无监督学习问题的例子。

现在，为了训练一个有监督的学习算法，你确实需要提供它的基本真理。标记数据的缺乏并不会使问题失去监督，它只意味着您需要花费大量的精力来获取所需的标记数据，否则您就无法训练您的算法。实际上，获取所有数据的标签/目标值往往是不现实的或过于昂贵的。因此，也有一类半监督算法，在一定的假设条件下，使用有标记和无标记的数据进行监督学习。

简言之，一个问题是否受到监督取决于问题的性质。有些问题要求你有标签数据来训练你的学习算法，而有些问题则没有，但是不管你有没有标记数据，都不应该改变你想要解决的问题的本质。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/9573

复制

相似问题

问监督学习和标签
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问监督学习和标签EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问监督学习和标签
EN