首先:我知道什么是早停,为什么它是重要的。但是,我确实有一个关于这种技术的Keras实现的问题:
如果我指定了一个耐心参数,而观察到的值并没有进一步改善;Keras是返回网络在最低观察值点上的状态,还是Keras返回该节点的网络状态,耐心“耗尽”?
换句话来说:
让s_0是我的网络在t_0时代的状态(其中记录了我观察到的度量的最低值)。假设x是耐心值,s_x是我的网络在t_x时代的状态。如果训练停止,Keras是返回s_0还是s_x?
发布于 2018-09-21 14:39:36
https://stackoverflow.com/questions/52443178
复制相似问题