首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >了解2D卷积输出大小

了解2D卷积输出大小
EN

Stack Overflow用户
提问于 2021-02-09 15:52:47
回答 1查看 177关注 0票数 0

我是卷积数字图书馆的初学者。我在论文Simultaneous Feature Learning and Hash Coding with Deep Neural Networks中看到了以下架构:对于大小为256*256的图像,

我不理解第一个2D卷积的输出大小: 96*54*54。96看起来很好,因为过滤器的数量是96。但是,如果我们对输出大小应用以下公式:size = [(W−K+2P)/S]+1 = (256 - 11 + 2*0)/4 +1= 62.25 ~62。我假设填充P为0,因为论文中没有提到它。Keras Conv2D API产生相同的96*62*62大小输出。那么,为什么论文指向96*54*54?我遗漏了什么?

EN

回答 1

Stack Overflow用户

发布于 2021-02-09 16:12:31

嗯,这让我想起了AlexNet paper,在那里我也犯了类似的错误。你的计算是正确的。我认为他们错误地写了256x256而不是224x224,在这种情况下,输入层的计算是,

(224-11+2*0)/4 +1= 54.25 ~ 54

作者很可能错误地写了256x256,而不是实际的架构输入大小为224x224 (在AlexNet中也是这样),或者另一个不太可能的选择是,他们写了256x256,这是真实的架构输入大小,但计算的是224x224。后者是可以忽略的,因为我认为这是一个非常愚蠢的错误,我甚至不认为这是一个选择。

因此,我认为真正的输入大小是224x224而不是256x256。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66114952

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档