我有一个有10个类的定制数据集,我正在使用一个来自火炬视觉的预先训练过的resnet18模型。我可以清楚地看到它的过度拟合,因为:该模型被训练为75个历元,批次大小为4,从epoch 30开始,验证精度停止增加,训练精度不断提高。
以上是所有这些结果之后,我想不出其他正则化技术,如果不改变模型的架构,这将完全违背预先训练的网络的目的,我使用一个,因为我只有大约300张图像在我的每堂课。
发布于 2020-07-12 11:02:38
在迁移学习中,有两个影响基本设置的参数:
当您的数据集很小时,问题是如果您重新训练了太多的层,那么高容量的预先培训的模型很容易就会变得过于适合。既然你重新训练了多层,这可能是个问题。
相反,尝试以下两个选项:
如果你对这个话题的理论阅读感兴趣,那么“深层神经网络中的特征是如何传递的?”的论文可能会引起你的兴趣。
https://datascience.stackexchange.com/questions/77579
复制相似问题