很长一段时间以来,我对理解一些AlexNet体系结构感到困惑:

第一个conv层的输出是55x55x48 (96个考虑到GPU之间的划分,但让我们坚持1个GPU,所以深度48)。然后应用max池,就会出现我的问题。
当应用max池时,结果是27x27x48,对吗?如果是这样,如何将这个结果的下一个卷积(带有5x5x48滤波器)应用于输出27x27x128?最后,我不知道如何以及何时在卷积之间应用最大池。我一定是错过了什么..。
发布于 2017-12-04 19:29:48
好的,我知道了。如果有人感兴趣,他们使用5x5滤波器,但与填充2和步幅1,以便在偏倚时,不改变输出的2D维数时,应用到最大池的结果。原来的纸上没有填充物的信息.
发布于 2017-12-05 15:36:36
它使用相同的填充,这意味着最大池的输出用零填充,使得下一层的输出保持宽度和高度。有关信息,请看一下这里。
https://datascience.stackexchange.com/questions/25380
复制相似问题