首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >超参数与ValidationSet

超参数与ValidationSet
EN

Data Science用户
提问于 2018-06-07 05:06:55
回答 1查看 633关注 0票数 3

如果我错了,请纠正我。“训练集用于计算机器学习模型的参数,验证数据用于计算同一模型的超参数(我们使用相同的权重和不同的超参数),测试集用于评估我们的模型”。如果是这样的话,有人能更详细地解释整个过程吗?蒂娅。

EN

回答 1

Data Science用户

发布于 2018-06-07 06:52:43

不完全是真的。在验证集中,我们找到了最优的超参数,但模型的参数不同。也就是说,对于超参数的每一个值,我们运行训练过程,得到这组超参数的损失,并选择验证损失最小的超参数值。

<#>编辑

岭回归例子:岭回归依赖于一个参数,$\lambda$,它惩罚您的模型权重。岭回归只有一个超参数。由于岭回归是一个线性模型,它也有一些权重$\theta_0,点,\theta_n$ (参数)来训练。选择$\lambda$和$\theta_0、\dots、\theta_n$的方法如下:

  • 对于网格中的每个$\lambda$值,通过梯度下降训练岭回归模型(从而优化训练损失),得到一组参数$\theta_0^*,\dots,\theta_n^*$。我们在验证集中测量训练过的岭模型的损失。
  • 我们选择$\lambda$来最小化验证集中的损失和参数$\theta_0^*、\dots、\theta_n^*$。如果我们愿意,而且我们没有太多的数据,我们可以用最优的$\lambda$对岭模型进行再训练,得到一些参数$\hat\theta_0,\dots,\hat\theta_n$。
  • 我们用最后一步得到的参数来计算测试误差,并将其作为模型误差的最真实值。
票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/32766

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档