发布于 2019-10-28 13:08:24
这两条曲线都显示了y轴上估计器的训练和验证分数.
一个学习曲线在不同数量的训练样本上绘制分数,而一个验证曲线在一个变化的超参数上绘制分数。
学习曲线是一种工具,用于判断一个估计器是否会从更多的数据中受益,或者模型是否过于简单(有偏)。

上面的例子显示了分类器的训练曲线,其中训练和验证分数收敛到一个低值。这个分类器很难从增加更多的训练数据中获益;一个更有表现力的模型可能更合适。
验证曲线是找到好的超参数设置的工具。一些超参数(神经网络中的神经元数目、决策树中的最大树深度、正则化的数量等)控制模型的复杂性。我们希望模型足够复杂,以捕获相关信息的培训数据,但不太复杂,以避免过度拟合。

上面的例子显示了支持向量机伽马参数上的验证曲线。伽马值太低对模型的限制太大;训练和验证分数都很低。高值的伽马会导致过度拟合:很好的训练分数,但验证分数很低。最优值在中间的某个地方,在那里曲线不会有太多的分歧。
图片来源:科学知识-学习文档
https://datascience.stackexchange.com/questions/62303
复制相似问题