众所周知,用于目标检测的nVidia DetectNet - CNN (卷积神经网络)是基于Yolo/DenseBox:https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/的方法。
DetectNet是流行的GoogLeNet网络的扩展。这些扩展类似于Yolo和DenseBox论文中采用的方法。
如图所示,DetectNet可以检测任何旋转的对象(cars):https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/

现代CNN (卷积神经网络)是DetectNet旋转不变的吗?
我能用同一旋转角度对数千幅不同的图像进行DetectNet训练,以检测任意旋转角度上的物体吗?

那么旋转不变的是: Yolo,Yolo v2,DenseBox是基于哪一个DetectNet的呢?
发布于 2016-12-03 22:37:04
不是
在分类问题中,CNN不是旋转不变的。你需要包括在你的训练集图像与每一个可能的旋转。
您可以训练CNN将图像分类为预定义的类别(如果您想检测图像中的多个对象,如您的示例,您需要使用分类器扫描图像的每个位置)。
然而,这是一个对象检测问题,而不仅仅是一个分类问题。
在对象检测问题中,可以使用滑动窗口方法,但效率极低。相反,一个简单的CNN,其他建筑是最先进的。例如:
这些体系结构可以检测图像中任何位置的对象,但您还必须在具有不同旋转的训练集样本中包含(并且必须使用边界框标记训练集,这非常耗时)。
发布于 2017-10-26 07:43:36
发布于 2021-08-26 14:46:02
Detectron2最近增加了旋转速度更快的RCNN网络。要创建这样的模型,您应该为带有旋转边框的车辆创建注释,即:
rbbox = [center_x, center_x, width, height, angle]例如:

有关更多信息,请访问此链接。
https://stackoverflow.com/questions/40952163
复制相似问题