在第三课-行星中,我看到了这2行代码:
lr = 0.01
learn.fit_one_cycle(5, slice(lr))如果切片(min_lr,max_lr),那么我理解fit_one_cycle()将使用来自片的扩展学习速率(min_lr,max_lr)。(希望我对此的理解是正确的)
但在这种情况下,片(Lr)只有一个参数,
fit_one_cycle(5,lr)与fit_one_cycle(5,片(Lr))有什么不同?使用片( lr )而不是直接使用lr有什么好处?
发布于 2020-01-26 12:34:26
杰里米花了一段时间在第五课中解释了切斯特的作用。
我所理解的是,fastai.vision模块将体系结构划分为3组,并根据输入内容以可变的学习速度对它们进行培训。(起始层通常不需要很大的参数变化)
此外,如果使用“fit_one_ their”,则所有组都将使用各自的变量学习进行学习速率退火。
检查第5课https://course.fast.ai/videos/?lesson=5 (使用文本查找器快速转到“切片”部分)
https://stackoverflow.com/questions/59538623
复制相似问题