著名的LeNet-5架构如下所示:

图层S2的输出维数为: 10x10x6 -因此基本上是一幅有6次抽搐的图像,用于导出特征。
如果每个维度再次提交给6个过滤器,则结果输出将为10x10x36,但为10x10x16。一开始,我无意中发现了它,但最后我发现,这是通过将来自层S2的输入组合起来并在其上应用一个内核来完成的,正如本文中所解释的那样:
层C3是一个卷积层,有16个特征映射,每个特征映射中的每个单元都连接到S2s特征映射子集中相同位置的几个5x5个邻域。
。
表一中的连接方案的基本原理是,下面六个C3功能映射从S2中的三个特征映射的每个连续子集中获取输入。接下来的六个从四个连续子集中获取输入。接下来的三个从四个不连续子集输入,最后一个从所有S2功能映射层输入,C3有1516个可训练参数和151,600个连接。
它的路线图载于表中:

我仍然不支持的是,我应该如何将它们结合起来?
在前一层中,我刚刚在一维上应用了6个内核,从而产生了6个维度,这是可以理解的。老实说,我有点不知所措。
请帮帮忙。马图斯
发布于 2019-10-06 23:07:20
请参阅此表,其中每一行都有16个数字。我不知道如何对齐,所以我也发了一张照片。
过滤0 1 2 3 4 5 6 7 8 10 11 12 13 14 15
重量75 75 75 100 100 100 150
偏压1 1 1
可训练参数76 76 76 101 101 101 151

https://datascience.stackexchange.com/questions/44933
复制相似问题