发布于 2018-01-22 18:19:12
它只是将变量更新乘以(请参阅更新op实现)。
对于任何“自动学习速率”方案,您都可以使用常量来扩展结果更新(是否有必要这样做是一个单独的问题)。
发布于 2018-01-19 12:05:42
Adadelta优化器可以自适应地改变学习速度,但仍然需要一个学习速率的初始值。尽管正如您在tensorflow 源代码中看到的那样,为了实现Adadelta论文的确切结果,您应该将其设置为1.0:
learning_rate:
Tensor或浮点值。学习率。要匹配原始论文中的确切形式,请使用1.0。
https://stackoverflow.com/questions/48339893
复制相似问题