在https://github.com/Yuanbo2020/Audio-Visual-VAD/tree/main/Code/framework复制开源代码的过程中,我遇到了这个问题,但我没有找到解决方案。我使用了keras2.4.3和tf2.30作为后端。因为开源代码没有数据处理代码,所以我这样做是因为我理解了论文和代码。它是一个多输出网络,我试着检查网络的输入,x包含音频(N,15,64,3)和视频(N,450,300,3),y包含14个张量,形状为(N,1)。
发布于 2022-03-04 10:58:49
经过近2小时的调试,发现关键是在计算损失时,由于它是一个多输出网络,所以使用了10个损失函数,并输入了形状为(N,1)的14个张量的标签,这就是为什么会出现“输入结构长度14,浅结构长度10”的情况。当您遇到这个问题时,请仔细检查输入的特征形状和标签,网络的输出形状。
发布于 2022-07-04 11:50:35
尝试使用Tensorflow==2.2.0和Keras==2.3.1,因为它们不会产生这样的错误
https://stackoverflow.com/questions/71350360
复制相似问题