最近,我尝试使用tensorflow来实现基于文章cnn+ctc的https://arxiv.org/pdf/1701.02720.pdf网络。
我尝试将分批光谱图数据(形状:( 10,120,155,3),batch_size为10)输入到10个卷积层和3个完全连接层。因此,连接ctc层之前的输出是2d数据(形状:(10,1024))。
这是我的问题:我想在tensorflow库中使用tf.nn.ctc_loss函数,但是它生成输入形状为:?,1024,3的ValueError:维度必须是2,但对于“Transpose”(op:‘Transpose’)来说是3。
我猜这个错误与我的2d输入数据的维数有关。ctc_loss函数在tensorflow官方站点中的描述需要一个带有形状的3d输入(batch_size X max_time X num_classes)。
那么,“num_classes”的额外维度是什么?应该如何更改cnn+fc输出数据的形状?
发布于 2017-08-27 21:52:29
每个时间步骤都要应用完全连接的层。这就像在递归神经网络中每一时间步长使用相同的稠密层。对于卷积层的输出,时间步长为宽度。
因此,例如,输出形状是:
这是预计的形状,ctc_loss在丹苏尔流。
https://stackoverflow.com/questions/44762631
复制相似问题