首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在Keras中使用Functional API检查模型输入时出错

在Keras中使用Functional API检查模型输入时出错
EN

Stack Overflow用户
提问于 2019-11-04 19:14:06
回答 1查看 35关注 0票数 1

我使用以下指南使用Keras制作了一个数据生成器方案:

https://stanford.edu/~shervine/blog/keras-how-to-generate-data-on-the-fly

我的数据生成器脚本似乎可以正确地生成numpy数组。然而,当我使用Functional API创建我的模型时,我得到了以下错误:

ValueError:检查模型输入时出错:传递给模型的Numpy数组列表不是模型预期的大小。预期会看到%2个数组,但却得到了以下%1个数组的列表:

我似乎不理解这个错误。我的模型接受两个不同的输入。它将一个大小为7000 x 208的矩阵作为卷积层的输入,并将一个向量(7000,)作为神经网络的输入。并且这两个分支被合并并提供给全连接层,随后是输出层。这是我如何设置我的网络:

代码语言:javascript
复制
ksize = 2
l2_lambda =  0.0001

i1 = Input(shape=(7000, 208))



c1 = Conv1D(128*2, kernel_size=ksize,activation='relu',kernel_regularizer=keras.regularizers.l2(l2_lambda))(i1)
c1 = Conv1D(128*2, kernel_size=ksize, activation='relu',kernel_regularizer=keras.regularizers.l2(l2_lambda))(c1)
c1 = AveragePooling1D(pool_size=ksize)(c1)
c1 = Dropout(0.2)(c1)
c1 = Flatten()(c1)

i2 = Input(shape=(7000, ))
c2 = Dense(64,  activation='relu',kernel_regularizer=keras.regularizers.l2(l2_lambda))(i2)
c2 = Dropout(0.1)(c2)

c = concatenate([c1, c2])

x = Dense(256, activation='relu', kernel_initializer='normal',kernel_regularizer=keras.regularizers.l2(l2_lambda))(c)
x = Dropout(0.25)(x)
output = Dense(5, activation='softmax')(x)

model = Model([i1, i2], [output])

model.summary()

model.compile(loss=keras.losses.categorical_crossentropy,
                  optimizer=keras.optimizers.Adam(),
                  metrics=['accuracy'])

model.fit_generator(generator=training_generator,validation_data=validation_generator)

我的生成器脚本基本上是生成一定大小的批处理,这样我就不必一次将所有内容都加载到内存中。用于数据生成的脚本

代码语言:javascript
复制
class DataGenerator(keras.utils.Sequence):
    def __init__(self,list_IDs_snp,list_IDs_pos,labels,batch_size=32,n_channels=1,
                 n_classes=5,shuffle=True):
        self.batch_size = batch_size
        self.list_IDs_snp = list_IDs_snp
        self.list_IDs_pos = list_IDs_pos
        self.n_channels = n_channels
        self.n_classes = n_classes
        self.shuffle = shuffle
        self.labels = labels
        self.on_epoch_end()

    def __len__(self):
        'Denotes the number of batches per epoch'
        return int(np.floor(len(self.list_IDs_snp) / self.batch_size))

    def __getitem__(self, index):
        'Generate one batch of data'
        # Generate indexes of the batch
        indexes = self.indexes[index*self.batch_size:(index+1)*self.batch_size]

        # Find list of IDs
        list_IDs_temp_snp = [self.list_IDs_snp[k] for k in indexes]
        list_IDs_temp_pos = [self.list_IDs_pos[k] for k in indexes]

        # Generate data
        snp,pos,y = self.__data_generation(list_IDs_temp_snp,list_IDs_temp_pos)

        return snp,pos,y

    def on_epoch_end(self):
        self.indexes = np.arange(len(self.list_IDs_snp))
        if self.shuffle==True:
            np.random.shuffle(self.indexes)

    def __data_generation(self,list_IDs_temp_snp,list_IDs_temp_pos):
        snp = np.empty((self.batch_size,7000,208))
        pos = np.empty((self.batch_size,7000))
        y = np.empty((self.batch_size),dtype=int)

        for ID in range(len(list_IDs_temp_snp)):
            snp[ID] = np.load(list_IDs_temp_snp[ID])
            pos[ID] = np.load(list_IDs_temp_pos[ID])
            y[ID] = self.labels[list_IDs_temp_snp[ID]]
        return snp,pos,y

此数据生成方案与我在开始时共享的链接相同。

为了生成数据,我按如下方式调用脚本:

代码语言:javascript
复制
params = {'batch_size': 3,
          'n_classes': 5,
          'n_channels': 1,
          'shuffle': True}

training_generator = DataGenerator(partition_snp['train'], partition_pos['train'],labels, **params)
validation_generator = DataGenerator(partition_snp['valid'],partition_pos['valid'], labels, **params)

你认为问题可能是我分别发送了partition_snp和partition_pos吗?Partition_snp和partition_pos只是包含每个示例的路径的字典。每个字典都有两个关键字:'train‘和'valid.’‘。

如果有人能解释一下为什么我会收到上面提到的错误,我将非常感激。在执行代码时,我打印了矩阵和向量的类型,它显示为numpy数组,因此,我不知道为什么会出现这个错误。真知灼见将不胜感激。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-11-04 21:59:59

问题出在您的__getitem__方法中,您返回一个包含三个元素的元组,而它应该是一个输入列表和一个输出列表,作为一个元组,例如:

代码语言:javascript
复制
def __getitem__(self, index):
    'Generate one batch of data'
    # Generate indexes of the batch
    indexes = self.indexes[index*self.batch_size:(index+1)*self.batch_size]

    # Find list of IDs
    list_IDs_temp_snp = [self.list_IDs_snp[k] for k in indexes]
    list_IDs_temp_pos = [self.list_IDs_pos[k] for k in indexes]

    # Generate data
    snp,pos,y = self.__data_generation(list_IDs_temp_snp,list_IDs_temp_pos)

    return [snp, pos], y

因为您只有一个输出,所以不需要列表。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58692288

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档