首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >机器学习中的学习曲线是什么?

机器学习中的学习曲线是什么?
EN

Stack Overflow用户
提问于 2011-01-07 00:48:44
回答 10查看 35.5K关注 0票数 57

我想知道机器学习中的学习曲线是什么。绘制它的标准方法是什么?我的意思是我的图的x轴和y轴应该是什么?

EN

回答 10

Stack Overflow用户

回答已采纳

发布于 2011-01-07 10:45:50

它通常指的是预测精度/误差与训练集大小的关系图(即:随着用于训练的实例数量的增加,模型预测目标的效果如何)

通常,训练和测试/验证性能被绘制在一起,这样我们就可以诊断bias-variance tradeoff (即,确定我们是否从添加更多训练数据中受益,并通过控制正则化或特征数量来评估模型复杂性)。

票数 55
EN

Stack Overflow用户

发布于 2012-12-05 10:14:53

我只想对这个老问题做一个简短的说明,指出学习曲线和曲线不是同义词。

如这个问题的其他答案所示,学习曲线通常描述当另一个参数(在水平轴上)发生变化时,垂直轴上的性能改善,例如训练集大小(在机器学习中)或迭代/时间(在机器和生物学习中)。一个突出的点是,模型的许多参数在曲线图上的不同点处发生变化。这里的其他答案在说明学习曲线方面做得很好。

(在工业制造中,学习曲线还有另一种含义,源于20世纪30年代的一项观察,即生产一个单位所需的劳动小时数以统一的速度减少,因为制造的单位数量翻了一番。它并不真正相关,但值得注意的是它的完整性和避免在web搜索中的混乱。)

相比之下,接收器操作特征曲线ROC曲线不显示学习;它显示性能。ROC曲线是分类器性能的图形描述,它显示了随着分类器的辨别阈值的变化,在增加真阳性率(在垂直轴上)和增加假阳性率(在水平轴上)之间的权衡。因此,只有一个与模型相关的参数(决策/判别阈值)在图上的不同点处发生变化。这条ROC曲线(from Wikipedia)显示了三种不同分类器的性能。

这里没有描述学习,而是关于两种不同类别的成功/错误的性能,因为分类器的决策阈值变得更加宽松/严格。通过查看曲线下的区域,我们可以看到分类器区分类的能力的总体指示。此曲线下面积度量对两个类中的成员数量不敏感,因此如果类成员关系不平衡,它可能无法反映实际性能。ROC曲线有许多字幕,感兴趣的读者可以查看:

Fawcett, Tom. "ROC graphs: Notes and practical considerations for researchers." Machine Learning 31 (2004): 1-38.

Swets, John A., Robyn M. Dawes, and John Monahan. "Better decisions through Science." Scientific American (2000): 83.

票数 33
EN

Stack Overflow用户

发布于 2011-01-07 08:21:41

有些人使用“学习曲线”来表示迭代过程的误差作为迭代次数的函数,即它说明了某个效用函数的收敛性。在下面的示例中,我将最小均方(LMS)算法的均方误差(MSE)绘制为迭代次数的函数。这说明了LMS“学习”有多快,在这种情况下,就是信道脉冲响应。

票数 17
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4617365

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档