开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >帮助解释主动学习曲线

问帮助解释主动学习曲线
EN

Data Science用户

提问于 2018-04-06 03:05:30

回答 1查看 174关注 0票数 -2

我正在应用一个主动学习的SGDClassifier (日志丢失函数)作为基础学习者的一些数据，我有以下的图表，表示查询与错误率的学习曲线。绿色是验证错误，蓝色是训练错误。

我的模型是否过拟合，还是在两个图中都有很大的差异？

machine-learning

active-learning

EN

回答 1

Data Science用户

回答已采纳

发布于 2018-04-06 06:27:52

过度贴合的可能性更大，因为：

经过一些查询，您的验证错误系统地高于培训错误，这可能不是您想要的。
经过一些查询后，您的培训错误会慢慢下降，而验证错误将保持不变。这就像你的分类器正在缓慢地记忆你的数据集。

当查询数量很小时，您的分类器看起来做得更好，因为它是一个更简单的数据集。同样，过度适应也可能是一个问题。

票数 2

EN

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/29972

复制

相似问题