在Caffe中,SGD求解器有一个动量参数(link)。在TensorFlow中,我看到tf.train.GradientDescentOptimizer没有显式的动量参数。但是,我可以看到有tf.train.MomentumOptimizer优化器。它是否等同于带有动量优化器的Caffe SGD?
发布于 2016-10-28 16:38:03
是的。tf.train.MomentumOptimizer = SGD +动量
发布于 2019-11-13 19:06:44
tf.keras.optimizers.SGD有一个momentum参数。使用nesterov=True也可以应用涅斯特罗夫动量。
https://stackoverflow.com/questions/40297848
复制相似问题