在Keras‘InceptionResNetV2 2模型的文档中,它说:
input_shape:(.)它应该有准确的3个输入通道,宽度和高度不应小于139。
我试图找出这个型号的最小尺寸为139‘m的原因,因为我希望在较小的图像上训练这个模型(对于初学者来说是128’m)。
我在模型源代码或本文对模型进行了描述。中找不到任何线索。
假设这个数字不是任意的,那么这个139 of的最小大小背后的原因是什么?
发布于 2022-04-06 05:43:16
下面是启动resnet v1的模式(基本上与V2相同)。您可以看到,在输入层,图像大小从299x299开始。当它到达Inception-resnet时,由于它经过的所有卷积和池层,它已经减少到8x8。现在,如果您输入较小的图像,最后一层将从8x8减少到类似5x5或其他什么。最终,有一个图像大小将开始缩小到0x0,这正好打破了我想象的139x139的model.So,您将开始拥有输出0x0的层。如果您真的想使用inception v2,那么您必须通过并更改所有的内核大小,这样它们才能使用该映像大小。这是一种耗时的方法,所以我只需要对你的图像进行零点,至少是139。这是一个非常好的模型,所以我认为你仍然会看到好的结果。

https://datascience.stackexchange.com/questions/24814
复制相似问题