训练期间Nvidia Digits UI中的基本学习率与咖啡因.prototxt文件中定义的每个层的学习率参数(Lr_pm)有什么不同。最后,使用哪个学习率?
发布于 2018-03-26 17:13:51
特定层的学习率是全局学习率乘以该特定层的lr_mult。
https://stackoverflow.com/questions/49378315
相似问题