如果我的第一个卷积有64个滤波器,第二个有32个滤波器。我是否会有:
1图像->卷积( 64个滤镜) -> 64 ImagesFiltred ->卷积( 32个滤镜) -> 64 x 32= 2048已过滤的图像
或者:
1图像->卷积( 64个滤镜) -> 64 ImagesFiltred ->卷积( 32个滤镜) -> 32个已过滤的图像
如果是第二个答案: 64 ImagesFiltred和第二个Conv之间发生了什么??
谢谢你的回答,在找不到一个好的教程解释清楚的时候,总是很匆忙…
发布于 2020-01-23 04:58:15
你的第一点是正确的。卷积本质上是从数据中改变和提取特征的方法。我们通过创建m个图像来做到这一点,每个图像都看着原始图像的某个帧。在这个第一卷积层上,我们然后为第一层中的每个卷积图像取n个图像。
因此: k1 *k2将是图像的总数。
为了进一步说明这一点,卷积通过制作图像的特征映射来工作。当你有连续的卷积层时,你就是在制作特征图的特征图。也就是说,如果我从1张图像开始,我的第一个卷积层的大小为20,那么我在卷积1的末尾有20个图像(更具体地说,特征映射)。然后假设我添加了大小为10的第二个卷积。然后发生的事情是,我为每1个图像生成10个特征映射。因此,它将是20*10图像= 200个特征映射。
比方说,你有一个50x50像素的图像。假设你有一个卷积层和一个大小为5x5的滤波器。如果您没有填充或其他任何东西,会发生什么)是您在图像中“滑动”,并在每次幻灯片迭代时获得像素的加权平均值(取决于您的位置)。然后,您将获得大小为5x5的输出特征映射。假设你这样做了20次(即5x5x20卷积),那么你就会有20个大小为5x5的特征图作为输出。在下面的VGG神经网络帖子中提到的图表中,该图表仅显示了为传入特征图制作的特征图的数量,而不是特征图的最终总和。
我希望这个解释是透彻的!
发布于 2020-01-23 15:19:14
Here we have the architecture of the VGG-16
在VGG-16中,我们有4个卷积: 64,128,256 512,在体系结构中,我们看到我们没有64个图像,64*128图像等,而只有64个图像,128个图像等
所以好的答案不是第一个,而是第二个。它暗示了我的第二个问题:
“64 ImagesFiltred和第二个Conv之间发生了什么??”
我认为在64和32的卷积之间,它们最终只有1个滤波器,但在两个像素的沙发上,所以它将卷积的厚度除以2。
在64cv和128cv之间,它们只是一个像素沙发上的2个滤波器,所以ti乘以2,of的厚度。
我说的对吗?
https://stackoverflow.com/questions/59868009
复制相似问题