我有三节课。(50k用于训练,12k用于验证)通过使用预训练的vgg16和resnet50,并冻结模型,仅在顶部训练密集层,我达到了99%的验证准确率。我应该通过解冻图层来优化功能,还是应该按原样使用这些功能?另外,vgg16是一个比Resnet50更好的特征提取器,还是我应该使用Resnet的功能?谢谢!
发布于 2017-09-05 17:47:12
这取决于您的问题域。如果您正在微调相同问题域的预训练模型,并且训练数据大小很小,则您所做的操作是正确的。
也许如果你只冻结第一层,这是经过良好训练的一般特征提取(egdes,blobs,shapes ..etc),你可以提高你的性能。如果要执行此操作,还建议应用数据增强,以避免过度拟合
我鼓励您查看以下关于迁移学习的教程,了解更多详细信息:http://cs231n.github.io/transfer-learning/
https://stackoverflow.com/questions/45554399
复制相似问题