文章/答案/技术大牛

发布

社区首页 >问答首页 >adam优化器与动量优化器

问adam优化器与动量优化器
EN

Stack Overflow用户

提问于 2016-11-14 20:20:44

回答 2查看 821关注 0票数 0

我正在尝试运行一个基于U-net架构的图像分割代码.在实验中，我发现Adam优化器的运行速度比动量优化器慢得多。我不知道这是否这两个优化者之间的共同观察？还是应该是依赖于数据的观察？

computer-vision

tensorflow

deep-learning

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-11-14 20:33:28

由于Adam算法是一种自适应学习速率算法，所以使用Adam的优化比动量优化运行慢，因为前者需要对每一参数的累积为一阶和二阶矩的指数移动平均。相反，后者不需要跟踪过去的梯度，也不需要为每个参数应用具有不同值的更新规则。

因此，您的观察是正确的，但它不依赖于数据，而是需要自己进行额外计算的优化算法，因此执行时间(对于每个火车步骤)都比较慢。

其优点是，使用自适应学习速率算法，即使单个步骤较慢，也可以达到最小速度。

票数 0

Stack Overflow用户

发布于 2016-11-14 20:26:36

它可能取决于您的框架；例如，对于MxNet：https://github.com/dmlc/mxnet/issues/1516来说，这是一个问题。在我的经验中，Adam趋向于与较少的时代趋同，尽管我意识到这与快速运行的优化器不同。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40597139

复制

相似问题

问adam优化器与动量优化器
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问adam优化器与动量优化器EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问adam优化器与动量优化器
EN