文章/答案/技术大牛

发布

社区首页 >问答首页 >为什么成批归一化允许我们在神经网络中使用更高的学习率？

问为什么成批归一化允许我们在神经网络中使用更高的学习率？
EN

Data Science用户

提问于 2019-12-02 00:12:51

回答 1查看 1.8K关注 0票数 1

我正在研究BatchNormalization：https://towardsdatascience.com/batch-normalization-8a2e585775c9

这篇文章说：

Using batch normalization allows us to use much higher learning rates, which further increases the speed at which networks train.

有谁能分享一下他们的想法，为什么批量标准化允许更高的学习率？谢谢!

neural-network

deep-learning

batch-normalization

回答 1

Data Science用户

发布于 2019-12-02 10:36:40

第3.3节对原来的批标准化文件有很好的解释为什么会这样。

具有较高学习率的

问题

首先，你需要理解高学习率的问题。较高的学习率会导致渐变的爆发或消失。换句话说，梯度是彼此相乘的，所以低层经历了较高层次梯度的复合效应。

如何帮助批处理规范化？

批处理规范化就是保持所有层的激活规范化，防止它们变得太大或太小。因此，这直接有助于防止爆炸/消失梯度。由于这个原因，批量标准化允许更高的学习率。

票数 4

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/64070

复制

相似问题

问为什么成批归一化允许我们在神经网络中使用更高的学习率？
EN

回答 1

Data Science用户

问题

如何帮助批处理规范化？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么成批归一化允许我们在神经网络中使用更高的学习率？EN

回答 1

Data Science用户

问题

如何帮助批处理规范化？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么成批归一化允许我们在神经网络中使用更高的学习率？
EN