他等人。“图像识别的深度残差学习”的论文在图3中说明了它们的剩余网络如下:

我不是神经网络专家,所以有人能解释一下“3x3conv,256,/2”上面的高亮符号是什么意思吗?第一部分是清晰的(具有3x3像素窗口的卷积神经网络),但是"256“和"/2”是什么?
发布于 2020-03-28 08:18:38
3x3 conv,256,/2
代表:
后者在第3页中作了解释,其中提交人指出
(ii)如果将特征地图的大小减半,则滤波器的数目将增加一倍,以保持每一层的时间复杂度。我们直接用步长为2的卷积层进行下采样。
这意味着,除了网络的开始和结束之外,ResNet不使用池层来减少空间维度,而是使用conv。图层。
此外,表1显示了正在发生的情况:

您在屏幕截图中突出显示的部分是从conv3_x过渡到34层网络的conv4_x层。从表中可以看到,输出大小从28x28减少到14x14 (这就是/2所做的),而过滤器从128个增加到256个。
https://datascience.stackexchange.com/questions/70348
复制相似问题