在快速RCNN方法中,将原始图像中的区域提案投影到最终卷积特征图的输出上。在VGG网的情况下,输入图像大小为224 x 244,卷积特征映射的最终输出为14 x 14 x 512。
这是否意味着将输入图像上的建议投影到功能地图上以供ROI池使用?投影是包围框的简单缩放吗?
发布于 2020-08-07 19:22:23
本文很好地描述了RoI池,以及如何从原始标签中获得功能映射的RoI BB等价物。
https://medium.com/datadriveninvestor/review-on-fast-rcnn-202c9eadd23b
基本上,RoI池的目标是从CNN输出特征图的任意大小部分输出一个固定大小的特征映射。
为此,您必须执行RoI投影,将RoI BB (x、y、h、w)从原始图像转换为特征地图中所需的RoI BB。这是通过缩放它基于次抽样率。
(前)
然后,您只需在特征映射的那一段进行池操作,其中有一个H×W个大小为H‘/H×w’/W的池窗口,其中H和W是池层目标输出的高度和宽度。
这篇文章给出了一个更好的描述,我鼓励您查看它和原始文件!
https://stackoverflow.com/questions/40925052
复制相似问题