首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何解释textsum模型的损失曲线?

如何解释textsum模型的损失曲线?
EN

Stack Overflow用户
提问于 2017-08-15 22:42:13
回答 1查看 190关注 0票数 0

我一直在训练文本和seq2seq w/注意模型的摘要摘要的训练语料库600 k文章+摘要。这算不算趋同呢?如果是这样的话,那么,在不到5k步的情况下,它会不会是正确的呢?考虑因素:

  • 我已经训练过200 K的声乐了
  • 5k步骤(直到接近收敛)的批次大小为4,这意味着最多可看到20k不同的样本。这只是整个训练语料库的一小部分。

或者我实际上没有看到我的狗的脸在茶叶和边缘负斜率是否如预期的?

EN

回答 1

Stack Overflow用户

发布于 2017-09-11 09:49:15

好的,我实际上切换到了GPU (而不是CPU)上的训练,并证明了模型仍然在学习。以下是初始化一个全新模型后的学习曲线:

使用AWSp2.x大型NVIDIA K80,加速比约为30倍。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45702608

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档