首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >现代CNN (卷积神经网络)是DetectNet旋转不变的吗?

现代CNN (卷积神经网络)是DetectNet旋转不变的吗?
EN

Stack Overflow用户
提问于 2016-12-03 20:27:16
回答 4查看 3.5K关注 0票数 9

众所周知,用于目标检测的nVidia DetectNet - CNN (卷积神经网络)是基于Yolo/DenseBox:https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/的方法。

DetectNet是流行的GoogLeNet网络的扩展。这些扩展类似于Yolo和DenseBox论文中采用的方法。

如图所示,DetectNet可以检测任何旋转的对象(cars):https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/

现代CNN (卷积神经网络)是DetectNet旋转不变的吗?

我能用同一旋转角度对数千幅不同的图像进行DetectNet训练,以检测任意旋转角度上的物体吗?

那么旋转不变的是: Yolo,Yolo v2,DenseBox是基于哪一个DetectNet的呢?

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2016-12-03 22:37:04

不是

在分类问题中,CNN不是旋转不变的。你需要包括在你的训练集图像与每一个可能的旋转。

您可以训练CNN将图像分类为预定义的类别(如果您想检测图像中的多个对象,如您的示例,您需要使用分类器扫描图像的每个位置)。

然而,这是一个对象检测问题,而不仅仅是一个分类问题。

在对象检测问题中,可以使用滑动窗口方法,但效率极低。相反,一个简单的CNN,其他建筑是最先进的。例如:

这些体系结构可以检测图像中任何位置的对象,但您还必须在具有不同旋转的训练集样本中包含(并且必须使用边界框标记训练集,这非常耗时)。

票数 6
EN

Stack Overflow用户

发布于 2017-10-26 07:43:36

在罗布的回答中,通常CNN本身是平移不变的,而不是旋转和尺度。但是,将所有可能的轮调纳入您的培训数据并不是强制性的。最大池层将引入旋转不变量。

由Franck 这里发布的这幅图像可能就是你要找的东西。

其次,关于Kershaw对Rob的回答的评论,他说:

CNN是不变的小水平或垂直的运动,在你的训练数据,主要是因为最大池。

CNN具有平移不变性的主要原因是卷积。过滤器将提取特征,而不管它在图像中的位置,因为过滤器将在整个图像中移动。当图像旋转或缩放时,由于特征像素表示的差异,滤波器将失败。

资料来源: Aditya来自此链接的答复。

票数 4
EN

Stack Overflow用户

发布于 2021-08-26 14:46:02

Detectron2最近增加了旋转速度更快的RCNN网络。要创建这样的模型,您应该为带有旋转边框的车辆创建注释,即:

代码语言:javascript
复制
rbbox = [center_x, center_x, width, height, angle]

例如:

有关更多信息,请访问此链接

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40952163

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档