文章/答案/技术大牛

发布

社区首页 >问答首页 >超参数与ValidationSet

问超参数与ValidationSet
EN

Data Science用户

提问于 2018-06-07 05:06:55

回答 1查看 633关注 0票数 3

如果我错了，请纠正我。“训练集用于计算机器学习模型的参数，验证数据用于计算同一模型的超参数(我们使用相同的权重和不同的超参数)，测试集用于评估我们的模型”。如果是这样的话，有人能更详细地解释整个过程吗？蒂娅。

发布于 2018-06-07 06:52:43

不完全是真的。在验证集中，我们找到了最优的超参数，但模型的参数不同。也就是说，对于超参数的每一个值，我们运行训练过程，得到这组超参数的损失，并选择验证损失最小的超参数值。

<#>编辑

岭回归例子:岭回归依赖于一个参数，$\lambda$，它惩罚您的模型权重。岭回归只有一个超参数。由于岭回归是一个线性模型，它也有一些权重$\theta_0，点，\theta_n$ (参数)来训练。选择$\lambda$和$\theta_0、\dots、\theta_n$的方法如下：

对于网格中的每个$\lambda$值，通过梯度下降训练岭回归模型(从而优化训练损失)，得到一组参数$\theta_0^*，\dots，\theta_n^*$。我们在验证集中测量训练过的岭模型的损失。
我们选择$\lambda$来最小化验证集中的损失和参数$\theta_0^*、\dots、\theta_n^*$。如果我们愿意，而且我们没有太多的数据，我们可以用最优的$\lambda$对岭模型进行再训练，得到一些参数$\hat\theta_0，\dots，\hat\theta_n$。
我们用最后一步得到的参数来计算测试误差，并将其作为模型误差的最真实值。

票数 3

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/32766

复制

相似问题

问超参数与ValidationSetEN