首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >理解学习learning_curve

理解学习learning_curve
EN

Data Science用户
提问于 2021-10-12 10:04:46
回答 2查看 254关注 0票数 2

我一直在使用sklearn learning_curve,我有几个问题没有得到文档的回答(也请参阅这里这里),还有一些问题是由函数提出的。

以下是我的数据集模型中的一些学习曲线

产生它们的代码:

代码语言:javascript
复制
train_sizes, train_scores, valid_scores =learning_curve(linear_regression_model,rescaled_X_train,Y_train)
axes[0,0].plot(train_sizes,train_scores)
axes[0,1].plot(train_sizes,valid_scores)

train_sizes, train_scores, valid_scores =learning_curve(random_forest_model, rescaled_X_train,Y_train)
axes[1,0].plot(train_sizes,train_scores)
axes[1,1].plot(train_sizes,valid_scores)
  1. 这些文档使它看起来像是,行learning_curve(linear_regression_model, rescaled_X_train, Y_train)适合模型,而不是简单地显示模型以前是如何运行的?

如果它再次拟合模型--你如何传递超参数(例如,支持向量机或最大树深的伽马值)并确定正在使用的成本函数?

如果不是,这似乎很奇怪。我会假设线性回归器在默认情况下只是适合于最小二乘,而不是包含k-折叠验证的东西,因为如果我正确地查看了上面的图表,情况就会是这样。这就是滑雪板通常适合回归者的方式吗?

  1. 这些图上的y轴精度得分吗?
EN

回答 2

Data Science用户

回答已采纳

发布于 2021-10-12 16:08:29

术语学习曲线在不同的语境中可能有不同的含义,这是令人困惑的。

当谈到神经网络(和其他经过迭代训练的模型)时,学习曲线描述了模型的训练过程。它经常被用来决定什么时候停止训练。

在科学学习中,学习曲线被不同的解释。它描述了如果使用较少的数据进行(再)培训,您的模型将如何执行。这可以帮助您猜测模型是否可能通过获取更多的数据而得到改善。

当模型重新拟合时,使用在构造模型时指定的相同的超参数。

使用的分数函数也是模型的一个参数。许多回归模型默认为R2评分,这很可能是您绘制的分数。

票数 2
EN

Data Science用户

发布于 2021-10-12 11:38:19

调用learning_curve将为不同的训练数据集大小多次修改模型,这是正确的。在初始化要使用的模型时,您可以简单地传递特定的超参数,然后可以将模型传递给learning_curve作为estimator参数。实际使用的损失函数取决于您所提供的估计器的类型,搜索特定估计器的文档可能会为您提供更多关于拟合模型时使用的损失函数的信息。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/103066

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档