发布于 2016-01-01 08:54:20
监督学习和非监督学习的主要区别如下:
在监督学习中,您有一组标记的数据,这意味着您有输入和输出的值。你试图通过机器学习找到它们之间的真正关系,我们通常称之为数学模型。机器学习中有许多不同的算法,这些算法允许您获得数据的模型。您所寻求的目标,以及如何使用机器学习,是预测输出给定一个新的输入,一旦你知道模型。
在无监督的学习中,你没有标签的数据。你可以说你有输入,但没有输出。目的是在你的数据中找到某种模式。您可以找到您认为属于同一个组或输出的组或群集。在这里,您还必须获得一个模型。再一次,你所寻求的目标是能够预测给定一个新输入的输出。
最后,回到你的问题,如果你没有标签,你不能使用监督学习,你必须使用无监督学习。
发布于 2018-07-18 03:11:48
那句话很有误导性。这里有一个更好的方法来看待它:
一个问题是有监督的还是没有监督的,取决于你想要解决的问题的性质。在一个有监督的学习问题中,有一些你希望算法预测的基本真理。基本真理可以是离散的标签(分类),也可以是连续域的值(回归)。另一方面,一个没有监督的学习问题并不试图“预测”某种标签或价值。相反,它试图学习数据的更好的表示或结构。聚类和降维都是无监督学习问题的例子。
现在,为了训练一个有监督的学习算法,你确实需要提供它的基本真理。标记数据的缺乏并不会使问题失去监督,它只意味着您需要花费大量的精力来获取所需的标记数据,否则您就无法训练您的算法。实际上,获取所有数据的标签/目标值往往是不现实的或过于昂贵的。因此,也有一类半监督算法,在一定的假设条件下,使用有标记和无标记的数据进行监督学习。
简言之,一个问题是否受到监督取决于问题的性质。有些问题要求你有标签数据来训练你的学习算法,而有些问题则没有,但是不管你有没有标记数据,都不应该改变你想要解决的问题的本质。
https://datascience.stackexchange.com/questions/9573
复制相似问题