首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么不同优化器的模型大小会有很大的不同?

为什么不同优化器的模型大小会有很大的不同?
EN

Stack Overflow用户
提问于 2018-02-02 16:04:30
回答 1查看 79关注 0票数 1

对于TensorFlow,当优化器为tf.train.GradientDescentOptimizer时,我的模型大小(model.ckpt.data)为88M,但当优化器更改为tf.train.AdamOptimizer时,我的模型大小变为220M。

为什么会有这么大的差异呢?

EN

回答 1

Stack Overflow用户

发布于 2018-02-02 16:22:20

ADAM为每个可训练参数添加了两个运行方式(梯度和梯度平方)作为额外的不可训练参数,这意味着它将总参数的数量增加到三倍。这些不可训练的参数也会被保存,因为需要它们来重新启动学习过程。这就是模型检查点更大的原因。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48578272

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档