文章/答案/技术大牛

发布

社区首页 >问答首页 >CNN图像分类训练acc达到95%，而验证acc只有45%左右

问CNN图像分类训练acc达到95%，而验证acc只有45%左右
EN

Stack Overflow用户

提问于 2020-07-29 17:55:07

回答 1查看 109关注 0票数 0

我用Tensorflow和Keras学到了一些深度学习，所以我想做一些实际的实验。

我想用CAISAV5指纹数据集(总共20,000张指纹图像)训练一个模型，但在训练过程中，120个时期后训练准确率达到97%，而验证准确率保持在45%左右。结果如下：

Epoch 109/200
150/150 [==============================] - 23s 156ms/step - loss: 0.6971 - accuracy: 0.9418 - val_loss: 4.1766 - val_accuracy: 0.4171
Epoch 110/200
150/150 [==============================] - 23s 155ms/step - loss: 0.6719 - accuracy: 0.9492 - val_loss: 4.1447 - val_accuracy: 0.4379
Epoch 111/200
150/150 [==============================] - 24s 162ms/step - loss: 0.7003 - accuracy: 0.9388 - val_loss: 4.1439 - val_accuracy: 0.4396
Epoch 112/200
150/150 [==============================] - 24s 157ms/step - loss: 0.7010 - accuracy: 0.9377 - val_loss: 4.1577 - val_accuracy: 0.4425
Epoch 113/200
150/150 [==============================] - 24s 160ms/step - loss: 0.6699 - accuracy: 0.9494 - val_loss: 4.1242 - val_accuracy: 0.4371
Epoch 114/200
150/150 [==============================] - 25s 167ms/step - loss: 0.6814 - accuracy: 0.9456 - val_loss: 4.1966 - val_accuracy: 0.4288
Epoch 115/200
150/150 [==============================] - 24s 160ms/step - loss: 0.6440 - accuracy: 0.9590 - val_loss: 4.1586 - val_accuracy: 0.4354
Epoch 116/200
150/150 [==============================] - 23s 157ms/step - loss: 0.7877 - accuracy: 0.9212 - val_loss: 4.0408 - val_accuracy: 0.4246
Epoch 117/200
150/150 [==============================] - 23s 156ms/step - loss: 0.6728 - accuracy: 0.9504 - val_loss: 3.9317 - val_accuracy: 0.4567
Epoch 118/200
150/150 [==============================] - 25s 167ms/step - loss: 0.5710 - accuracy: 0.9874 - val_loss: 3.9505 - val_accuracy: 0.4483
Epoch 119/200
150/150 [==============================] - 24s 158ms/step - loss: 0.5616 - accuracy: 0.9873 - val_loss: 4.0607 - val_accuracy: 0.4542
Epoch 120/200
150/150 [==============================] - 23s 156ms/step - loss: 0.5948 - accuracy: 0.9716 - val_loss: 4.1531 - val_accuracy: 0.4238
Epoch 121/200
150/150 [==============================] - 23s 155ms/step - loss: 0.7453 - accuracy: 0.9150 - val_loss: 4.0798 - val_accuracy: 0.4154
Epoch 122/200
150/150 [==============================] - 26s 172ms/step - loss: 0.7232 - accuracy: 0.9256 - val_loss: 3.9307 - val_accuracy: 0.4425
Epoch 123/200
150/150 [==============================] - 24s 158ms/step - loss: 0.6277 - accuracy: 0.9632 - val_loss: 3.9988 - val_accuracy: 0.4408
Epoch 124/200
150/150 [==============================] - 23s 156ms/step - loss: 0.6367 - accuracy: 0.9581 - val_loss: 4.0837 - val_accuracy: 0.4358

我通过互联网搜索，发现过度拟合可以解释这一点，所以我试图简化图层，添加辍学和正则化，并使用批归一化。但这些方法对准确度的贡献很小。我还标准化了数据，已经打乱并将其浮点值转换为0.0和1.0之间的值。图像的原始分辨率为328 * 356，在送入自动编码器之前被调整为400 * 400。

下面是我的代码的一部分：

def encoder(input_img):
    #encoder
    
    conv1 = Conv2D(32, (3, 3), activation='relu', padding='same')(input_img) 
    conv1 = BatchNormalization()(conv1)
    conv1 = Conv2D(32, (3, 3), activation='relu', padding='same')(conv1)
    conv1 = BatchNormalization()(conv1)
    pool1 = MaxPooling2D(pool_size=(2, 2))(conv1) 
    conv2 = Conv2D(64, (3, 3), activation='relu', padding='same')(pool1) 
    conv2 = BatchNormalization()(conv2)
    conv2 = Conv2D(64, (3, 3), activation='relu', padding='same')(conv2)
    conv2 = BatchNormalization()(conv2)
    pool2 = MaxPooling2D(pool_size=(2, 2))(conv2) 
    conv3 = Conv2D(128, (3, 3), activation='relu', padding='same')(pool2)
    conv3 = BatchNormalization()(conv3)
    conv3 = Conv2D(128, (3, 3), activation='relu', padding='same')(conv3)
    conv3 = BatchNormalization()(conv3)
    return conv3

def fc(enco):
    pool = keras.layers.MaxPooling2D(pool_size = (2, 2))(enco)
    keras.layers.BatchNormalization()
    den1 = keras.layers.Dense(128, activation='relu', kernel_regularizer=regularizers.l2(1e-3))(pool)
    keras.layers.BatchNormalization()
    pool1 = keras.layers.MaxPooling2D(pool_size = (2, 2))(den1)
    keras.layers.Dropout(0.4)
    den2 = keras.layers.Dense(256, activation = 'relu', kernel_regularizer=regularizers.l2(1e-3))(pool1)
    keras.layers.BatchNormalization()
    pool2 = keras.layers.MaxPooling2D(pool_size = (2, 2))(den2)
    keras.layers.Dropout(0.4)
    den3 = keras.layers.Dense(512, activation = 'relu', kernel_regularizer=regularizers.l2(1e-4))(pool2)
    keras.layers.BatchNormalization()
    pool3 = keras.layers.AveragePooling2D(pool_size = (2, 2))(den3)
    keras.layers.Dropout(0.4)
    flat = keras.layers.Flatten()(pool3)
    keras.layers.Dropout(0.4)
    keras.layers.BatchNormalization()
    den4 = keras.layers.Dense(256, activation = 'relu', kernel_regularizer=regularizers.l2(1e-3))(flat)
    keras.layers.Dropout(0.4)
    keras.layers.BatchNormalization()

    out = keras.layers.Dense(num, activation='softmax',kernel_regularizer=regularizers.l2(1e-4))(den4)
    return out


encode = encoder(input_img)
full_model = Model(input_img,fc(encode))


for l1,l2 in zip(full_model.layers[0:15],autoencoder_model.layers[0:15]):
    l1.set_weights(l2.get_weights())


for layer in full_model.layers[0:15]:
    layer.trainable = False
full_model.summary()


full_model.compile(loss=keras.losses.categorical_crossentropy, optimizer=keras.optimizers.Nadam(),metrics=['accuracy'])

batch_size = 64

autoencoder_model已经经过训练，性能良好，损失低于3e-4。

所以我想知道是什么导致了低的验证准确率，我能做些什么来帮助它呢？

python

tensorflow

keras

conv-neural-network

回答 1

Stack Overflow用户

发布于 2020-07-30 00:09:59

最明显的结论是过度拟合，但考虑到你尝试了标准方法来纠正这一点，如模型简化、丢失和正则化，但没有任何改进，这可能是一个不同的问题。为了使验证准确率很高，验证数据的概率分布必须反映模型训练所依据的数据的概率分布。因此，问题是如何选择验证数据？作为测试，我会尝试的一件事是使验证数据成为训练数据的相同子集。在这种情况下，验证准确率应该接近100%。如果它没有变高，那么它可能指向您处理验证数据的方式。我还注意到您选择不训练模型中的某些层。尝试使所有层都是可训练的，看看这是否有帮助。我已经看到冻结模型中的权重会导致验证精度降低的情况。不知道为什么，但我相信如果不可训练的层包括dropout，那么随着权重的冻结dropout没有任何影响，从而导致过度拟合。我不是一个很喜欢提前停止的人。它是一个不能有效解决过度拟合问题的拐杖。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63150987

复制

相似问题

问CNN图像分类训练acc达到95%，而验证acc只有45%左右
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问CNN图像分类训练acc达到95%，而验证acc只有45%左右EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问CNN图像分类训练acc达到95%，而验证acc只有45%左右
EN