您的输入大小有一个限制，它对应于网络的最后一个卷积层的接收字段。直观地说，你可以观察到空间维数随着你通过网络而减少。至少这是用于从输入图像中提取特征嵌入的特征提取器CNN的情况。这是大多数预先训练的模型，如香草VGG，和ResNets网络不保留空间维数。如果卷积层的输入小于内核大小(即使/当填充时)，那么您就无法执行该操作。

票数 3

Stack Overflow用户

发布于 2022-01-11 22:24:23

例如，标准的resnet50模型只接受范围为193-225的输入，这是由于体系结构和向下缩放层造成的(见下文)。默认reason模型工作的唯一原因是它使用自适应池层，它允许不限制输入大小。所以它会起作用的，但是你应该准备好面对性能衰退和其他有趣的事情:)

希望你会发现它有用：

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69471729

复制

相似问题

问对于流行的计算机视觉模型，是否有实际的最小输入图像大小？(例如，vgg、resnet等)
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问对于流行的计算机视觉模型，是否有实际的最小输入图像大小？(例如，vgg、resnet等)EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问对于流行的计算机视觉模型，是否有实际的最小输入图像大小？(例如，vgg、resnet等)
EN