首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >帮助解释主动学习曲线

帮助解释主动学习曲线
EN

Data Science用户
提问于 2018-04-06 03:05:30
回答 1查看 174关注 0票数 -2

我正在应用一个主动学习的SGDClassifier (日志丢失函数)作为基础学习者的一些数据,我有以下的图表,表示查询与错误率的学习曲线。绿色是验证错误,蓝色是训练错误。

我的模型是否过拟合,还是在两个图中都有很大的差异?

EN

回答 1

Data Science用户

回答已采纳

发布于 2018-04-06 06:27:52

过度贴合的可能性更大,因为:

  • 经过一些查询,您的验证错误系统地高于培训错误,这可能不是您想要的。
  • 经过一些查询后,您的培训错误会慢慢下降,而验证错误将保持不变。这就像你的分类器正在缓慢地记忆你的数据集。

当查询数量很小时,您的分类器看起来做得更好,因为它是一个更简单的数据集。同样,过度适应也可能是一个问题。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/29972

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档