问在这种情况下，哪种模式更好？
EN

Stack Overflow用户

提问于 2020-10-21 14:57:13

回答 1查看 49关注 0票数 0

有两种神经网络模型。

第一种模型不存在正则化，从历元到第十阶段都存在过拟合现象，因此该模型在第9期停止训练，验证损失最小发生在历元9次。

第二种模型具有正则化(Dropout)，不显示过度拟合。因此，这种模式比第一种模式的训练时间长得多。但最小验证损失值并不高于第一模型的最小验证损失值。尽管这个模型可以训练得更多，但是这个模型似乎没有达到第一个模型的最小验证损失的值。

这些模型训练相同的数据集和结构几乎相同，除了是否使用正则化。

在这种情况下，哪一种更好？

keras

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-10-21 15:05:28

我不会使用第一个，如果你可以肯定地说，它是过分合适的。损失值是根据训练集而不是测试集计算的，因此该值可能很高，但这并不意味着模型对测试数据的性能会很好。如果第二个模型在后期继续得到不同的损失值，但损失并没有减少，您可以尝试修改参数或模型结构以找到正确的平衡。但我更倾向于相信一个在大多数情况下都不会过火的模型。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/64466328

复制

相似问题

问在这种情况下，哪种模式更好？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在这种情况下，哪种模式更好？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在这种情况下，哪种模式更好？
EN