首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >快速RCNN - ROI投影

快速RCNN - ROI投影
EN

Stack Overflow用户
提问于 2016-12-02 04:54:55
回答 1查看 1.1K关注 0票数 9

在快速RCNN方法中,将原始图像中的区域提案投影到最终卷积特征图的输出上。在VGG网的情况下,输入图像大小为224 x 244,卷积特征映射的最终输出为14 x 14 x 512。

这是否意味着将输入图像上的建议投影到功能地图上以供ROI池使用?投影是包围框的简单缩放吗?

EN

回答 1

Stack Overflow用户

发布于 2020-08-07 19:22:23

本文很好地描述了RoI池,以及如何从原始标签中获得功能映射的RoI BB等价物。

https://medium.com/datadriveninvestor/review-on-fast-rcnn-202c9eadd23b

基本上,RoI池的目标是从CNN输出特征图的任意大小部分输出一个固定大小的特征映射。

为此,您必须执行RoI投影,将RoI BB (x、y、h、w)从原始图像转换为特征地图中所需的RoI BB。这是通过缩放它基于次抽样率。

(前)

  • 如果你的图像是18x18,你的特征地图是3x3,那么你的次采样率是3/18。
  • 要得到投影的RoI BB,将其乘以原来的BB值,如x‘= (3/18)x。

然后,您只需在特征映射的那一段进行池操作,其中有一个H×W个大小为H‘/H×w’/W的池窗口,其中H和W是池层目标输出的高度和宽度。

这篇文章给出了一个更好的描述,我鼓励您查看它和原始文件!

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40925052

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档