我一直在研究GAN,让我抓狂的是,为什么我们要编译生成器模型,即使我们编译了组合的GAN模型,为什么还要单独编译生成器。
def create_generator():
generator = Sequential()
generator.add(Dense(256, input_dim=noise_dim))
generator.add(LeakyReLU(0.2))
generator.add(Dense(512))
generator.add(LeakyReLU(0.2))
generator.add(Dense(1024))
generator.add(LeakyReLU(0.2))
generator.add(Dense(img_rows*img_cols*channels, activation='tanh'))
generator.compile(loss='binary_crossentropy', optimizer=optimizer)
return generator
def create_descriminator():
discriminator = Sequential()
discriminator.add(Dense(1024, input_dim=img_rows*img_cols*channels))
discriminator.add(LeakyReLU(0.2))
discriminator.add(Dense(512))
discriminator.add(LeakyReLU(0.2))
discriminator.add(Dense(256))
discriminator.add(LeakyReLU(0.2))
discriminator.add(Dense(1, activation='sigmoid'))
discriminator.compile(loss='binary_crossentropy', optimizer=optimizer)
return discriminator
discriminator = create_descriminator()
generator = create_generator()
# Make the discriminator untrainable when we are training the generator. This doesn't effect the discriminator by itself
discriminator.trainable = False
# Link the two models to create the GAN
gan_input = Input(shape=(noise_dim,))
fake_image = generator(gan_input)
gan_output = discriminator(fake_image)
gan = Model(gan_input, gan_output)
gan.compile(loss='binary_crossentropy', optimizer=optimizer)正如在这段代码中可以看到的那样,生成器、鉴别器和gan (组合模型)都是经过编译的。根据我的理解,我们应该只编译鉴别器(用于训练鉴别器)和gan (组合模型,用于训练生成器),因为鉴别器权重在GAN训练期间被冻结,因此只有生成器得到训练。那么为什么要编译生成器呢?
发布于 2020-06-12 22:19:40
在训练过程中,generator和discriminator有着截然相反的目标:discriminator试图区分假图像和真实图像,而生成器则试图产生看起来足够真实的图像,以欺骗鉴别器。
由于GAN由具有不同目标的两个网络组成,因此它不能像常规神经网络那样进行训练。每个训练迭代分为两个阶段:
discriminator的权重是frozen的,因此反向传播只影响生成器的权重。接下来,我们需要编译这些模型。generator只会通过gan model,来训练,所以我们根本不需要编译。重要的是,discriminator 不应在第二阶段期间进行训练,因此我们将其设为non-trainable,然后再对gan模型进行compiling:
https://stackoverflow.com/questions/62303892
复制相似问题