首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何解释锯齿形训练的损失?

如何解释锯齿形训练的损失?
EN

Stack Overflow用户
提问于 2018-03-04 07:48:11
回答 2查看 2.7K关注 0票数 3

我的训练数据包括大约700个独特的样本(这是一个回归问题)。数据不被洗牌,所以第一个N个样本有相同的标签(例如,值1.25),然后下一个M样本有一个相同的标签(例如,2.99)等等。总共大约有15个唯一的标签。

我使用一个简单的CNN,因为输入是一个图像(64x64x3)。即使没有辍学或其他形式的正规化,我也无法使训练损失稳定在接近于零的水平。

这种学习缺失的模式是什么?(灰色线是训练损失,橙色线是验证损失)。

EN

回答 2

Stack Overflow用户

发布于 2018-03-04 12:34:19

从这种模式中你能得到的唯一指示就是学习率太高,你应该降低它,直到损失开始减少为止。

票数 1
EN

Stack Overflow用户

发布于 2018-10-03 11:21:58

似乎你的学习速度太大,使你的参数剧烈波动。

我当时建议的事情是:

  • 降低初始学习率
  • 尝试另一个具有某种学习速率衰减的优化器(例如,在这种情况下对我有用的亚当)。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49093182

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档