我对深造、巨蟒和火把都很陌生,所以请容忍我吧!
我正在尝试理解如何使用两种不同的预培训网络: Vgg11和Densenet121来理解火炬传递学习。我已经通过上述网络的“功能”部分运行了形状数据(3x224x224),输出形状如下:
Vgg11特性输出形状:512x7x7
Densenet121特性输出形状:1024x7 x7
现在,我试着用我自己的分类器来代替训练前的那台。在检查这两个预先训练的分类器时,我看到Vgg11分类器在第一层中有:
(0):线性(in_features=25088,out_features=4096,bias=True)
而Densenet121在第一层中有:
(分类器):线性(in_features=1024,out_features=1000,bias=True)
Vgg one是有意义的,因为如果将“功能”部分的输出扁平化,则得到512 x7x7= 25,088。
丹森尼特人怎么只有1024个维度?如果将其“功能”部分的输出扁平化,则得到1024x7x7= 50,176
他们中的任何一个我都错过了台阶吗?是否有方法检查每个层的输入和输出形状,并找出到底发生了什么?
谢谢。
https://stackoverflow.com/questions/60646996
复制相似问题