问一些划痕后训练和测试损失突然增加的原因
EN

Data Science用户

提问于 2019-06-23 06:19:42

回答 1查看 262关注 0票数 1

我们知道，如果训练和测试损失是不同的，我们的模型是过分合适的。然而，如果两个人在经历了一些时代后都走高了，我们又如何证明这一点呢？

解决这一问题的一种方法是将学习率降低到0.0001。

但是，实际上，我想知道这个突然增长背后的理论原因。

发布于 2019-06-23 11:41:47

这可能是因为高的学习率。

损失函数是凸的，模型需要达到最小值。学习速率决定了你走向最小的步骤的大小。如果你采取高学习率，你可能会超过最小值，从而突然增加的损失值。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/54320

复制

相似问题

问一些划痕后训练和测试损失突然增加的原因EN