我正在阅读用于目标检测的faster-rcnn和ssd代码。预测层使用3x3滤波器来预测盒子的位置和类别标签。
为什么不使用2x2滤波器或4x4滤波器或5x5滤波器来预测它们?

发布于 2019-04-11 19:59:42
这只是一个超参数的选择。这样的选择可以通过超参数搜索的交叉验证来进行,这意味着用不同的超参数选择训练几个模型,并查看谁在验证集上获得了最好的性能。特别是对于3x3卷积,自从VGG paper建议堆叠许多3x3卷积(被认为是小内核)可以提供良好的性能以来,这已经变得流行起来。
https://stackoverflow.com/questions/55584228
复制相似问题