正如我们所知,dropout是一种帮助控制过拟合的机制。在Keras的训练过程中,我们可以通过监测验证损失进行在线交叉验证,并在model.fit中设置数据拆分。
一般来说,我需要同时使用这两种机制吗?或者,如果我在model.fit中设置数据拆分,则不需要使用dropout。
发布于 2017-02-13 05:19:56
Dropout是一种正则化技术,即它可以防止网络过快地拟合您的数据。验证损失只是在你的网络过度拟合时给出的一个指示。这是两件完全不同的事情,当你的模型过拟合时,验证损失对你没有帮助,它只会告诉你它是过拟合的。
我想说的是,在训练过程中,验证损失是有价值的信息,你永远都不应该没有它。你是否需要正则化技术,如噪声,丢弃或批量归一化取决于你的网络如何学习。如果你发现它不适合,那么你应该尝试使用正则化技术。
https://stackoverflow.com/questions/42184791
复制相似问题