文章/答案/技术大牛

发布

社区首页 >问答首页 >Tensorflow为VGG模型返回10%的验证精度(不考虑历元数)？

问Tensorflow为VGG模型返回10%的验证精度(不考虑历元数)？
EN

Stack Overflow用户

提问于 2018-02-04 04:27:37

回答 1查看 530关注 0票数 1

我正在尝试用tensorflow中的keras软件包在CIFAR-10上训练一个神经网络。考虑的神经网络是VGG-16，我直接借用了官方的keras模型。定义是：

def cnn_model(nb_classes=10):
# VGG-16 official keras model
img_input= Input(shape=(32,32,3))
vgg_layer= Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv1')(img_input)
vgg_layer= Conv2D(64, (3, 3), activation='relu', padding='same', name='block1_conv2')(vgg_layer)
vgg_layer= MaxPooling2D((2, 2), strides=(2, 2), name='block1_pool')(vgg_layer)

# Block 2
vgg_layer= Conv2D(64, (3, 3), activation='relu', padding='same', name='block2_conv1')(vgg_layer)
vgg_layer= Conv2D(64, (3, 3), activation='relu', padding='same', name='block2_conv2')(vgg_layer)
vgg_layer= MaxPooling2D((2, 2), strides=(2, 2), name='block2_pool')(vgg_layer)

# Block 3
vgg_layer= Conv2D(128, (3, 3), activation='relu', padding='same', name='block3_conv1')(vgg_layer)
vgg_layer= Conv2D(128, (3, 3), activation='relu', padding='same', name='block3_conv2')(vgg_layer)
vgg_layer= Conv2D(128, (3, 3), activation='relu', padding='same', name='block3_conv3')(vgg_layer)
vgg_layer= MaxPooling2D((2, 2), strides=(2, 2), name='block3_pool')(vgg_layer)

# Block 4
vgg_layer= Conv2D(256, (3, 3), activation='relu', padding='same', name='block4_conv1')(vgg_layer)
vgg_layer= Conv2D(256, (3, 3), activation='relu', padding='same', name='block4_conv2')(vgg_layer)
vgg_layer= Conv2D(256, (3, 3), activation='relu', padding='same', name='block4_conv3')(vgg_layer)
vgg_layer= MaxPooling2D((2, 2), strides=(2, 2), name='block4_pool')(vgg_layer)

# Classification block
vgg_layer= Flatten(name='flatten')(vgg_layer)
vgg_layer= Dense(1024, activation='relu', name='fc1')(vgg_layer)
vgg_layer= Dense(1024, activation='relu', name='fc2')(vgg_layer)
vgg_layer= Dense(nb_classes, activation='softmax', name='predictions')(vgg_layer)

return Model(inputs=img_input, outputs=vgg_layer)

然而，在训练期间，我总是得到训练和验证精度为0.1，即10%。

validation accuracy for adv. training of model for epoch 1=  0.1
validation accuracy for adv. training of model for epoch 2=  0.1
validation accuracy for adv. training of model for epoch 3=  0.1
validation accuracy for adv. training of model for epoch 4=  0.1
validation accuracy for adv. training of model for epoch 5=  0.1

作为调试的一步，每当我用任何其他型号(例如，任何简单的CNN模型)替换时，它都能很好地工作。这表明脚本的其余部分运行良好。

例如，下面的CNN模型工作得很好，在30年代后达到了75%的精度。

def cnn_model(nb_classes=10, num_hidden=1024, weight_decay= 0.0001, cap_factor=4):
model=Sequential()
input_shape = (32,32,3)
model.add(Conv2D(32*cap_factor, kernel_size=(3,3), strides=(1,1), kernel_regularizer=keras.regularizers.l2(weight_decay), kernel_initializer="he_normal", activation='relu', padding='same', input_shape=input_shape))
model.add(Conv2D(32*cap_factor, kernel_size=(3,3), strides=(1,1), kernel_regularizer=keras.regularizers.l2(weight_decay), kernel_initializer="he_normal", activation="relu", padding="same"))
model.add(MaxPooling2D(pool_size=(2,2), strides=(2,2)))
model.add(BatchNormalization())
model.add(Dropout(0.25))

model.add(Conv2D(64*cap_factor, kernel_size=(3,3), strides=(1,1), kernel_regularizer=keras.regularizers.l2(weight_decay), kernel_initializer="he_normal", activation="relu", padding="same"))
model.add(Conv2D(64*cap_factor, kernel_size=(3,3), strides=(1,1), kernel_regularizer=keras.regularizers.l2(weight_decay), kernel_initializer="he_normal", activation="relu", padding="same"))
model.add(MaxPooling2D(pool_size=(2,2), strides=(2,2)))
model.add(BatchNormalization())
model.add(Dropout(0.25))

model.add(Flatten())
model.add(Dense(num_hidden, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(nb_classes, activation='softmax'))
return model

在我看来，这两个模型的定义都是正确的。然而，一个完美的工作，而另一个根本不学习。我还试着用顺序结构来编写VGG模型，也就是类似于第二个结构，但它仍然给了我10%的精度。

即使模型没有更新任何权重，"he_normal“初始化器也可以轻松地获得比纯机会更好的精度。似乎在某种程度上，tensorflow从模型中计算出输出逻辑，从而使模型的精度成为纯粹的机会。

如果有人能指出我的错误，我会很有帮助的。

tensorflow

neural-network

keras

conv-neural-network

vgg-net

回答 1

Stack Overflow用户

发布于 2018-02-04 10:14:31

您的10%与nr的类= 10，这使我认为，无论培训，您的答案始终是"1“的所有类别，什么不断给你10%的准确性在10个类别。

检查未经训练的模型的输出，如果总是1
如果是的话，检查模型的初始权值，可能是错误初始化的，梯度为零，并且不能收敛。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/48604708

复制

相似问题

问Tensorflow为VGG模型返回10%的验证精度(不考虑历元数)？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tensorflow为VGG模型返回10%的验证精度(不考虑历元数)？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tensorflow为VGG模型返回10%的验证精度(不考虑历元数)？
EN