问如何检测textsum训练是否过度拟合？
EN

Stack Overflow用户

提问于 2016-11-16 08:32:35

回答 1查看 164关注 0票数 1

我正在使用Tensorflow 0.9，并使用Textsum模型进行训练。我搜集了大约130万篇文章，并且已经针对它们进行了大约一周的训练。平均损失约为1.75 - 2.1。我决定停下来运行eval，因为我的理解是，我的平均损失应该接近我通过训练获得的损失。当我运行eval时，我看到了2.6到2.9的平均损失。我只是想知道在执行这个运行时我应该看到什么。

我是否正确使用此训练/评估分析？我对深度学习有些陌生，并试图将其作为学习的一种方式，并通过一些其他阅读，似乎这可能是两者之间的一个很大的差异。

对不同的数据集进行评估是否有标准的容差，平均损失的差异应该是多少？在这一点上，我不确定我是应该继续训练，还是暂时止步于此，并试图弄清楚如何在tensorflow服务中运行它。我不想过度拟合这个模型，但从学术的角度来看，我们可以说我通过训练实现了过度拟合。我需要做些什么来“修复”它？你现在只是简单地获取更多的文章和数据作为培训，还是模型本质上是坏的和不可用的？

machine-learning

tensorflow

deep-learning

textsum

回答 1

Stack Overflow用户

发布于 2017-03-09 06:03:29

不能保证评估损失与训练损失相匹配。过拟合很难衡量，但如果评估损失随着训练的进行而增加，这是一个明显的迹象。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40622150

复制

相似问题

问如何检测textsum训练是否过度拟合？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何检测textsum训练是否过度拟合？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何检测textsum训练是否过度拟合？
EN