在阅读了使用CNN检测物体的最新进展(R快速R,YOLO,SSD.)我想知道是否有一种使用RNN的方法,还是将CNN和RNN的方法结合起来进行目标检测?谢谢
发布于 2018-02-21 15:31:10
是的,有很多尝试,但也许最值得注意的是在安德烈杰·卡萨帕和李斐-费的论文中描述的方法,他们将一个CNN和RNN串联在一起(CNN在图像区域+双向RNN +多模式RNN),并使用这个方法标记一个完整的句子。不过,这不仅仅是目标检测,因为它利用一组场景及其描述来生成新的未见图像的自然语言描述。
另一个例子是明梁与胡小林的称谓,他们将CNN和RNN混为一谈,并使用这种架构来更好地检测对象。正如明和小林在他们的论文中所解释的(链接在上面),RNN被用来改进CNN:
一个显著的区别是CNN通常是一种前馈架构,而在视觉系统中,循环连接非常丰富。受到这一事实的启发,我们提出了一个递归CNN (RCNN),通过在每个卷积层中加入递归连接来识别对象。
发布于 2018-06-14 21:54:26
实际上,我不认为使用RNN进行目标检测是一种很好的方法,因为与CNN相比,RNN中没有“接受场”的概念,这应该是做视觉相关任务的一个关键点。
发布于 2019-02-21 04:38:35
递归神经网络( RNN )是序列数据的最新算法,而长时记忆(LSTM)网络是RNN的扩展。该方法可用于视频或运动图像中的目标检测,可以尝试此https://github.com/tensorflow/models/tree/master/research/lstm_对象_检测。本文提出了一种基于Tensorflow的移动视频对象检测实现方案:基于时间感知特征图的移动视频对象检测(CVPR 2018)。纸的链接:http://openaccess.thecvf.com/content_cvpr_2018/文件/刘_莫比尔县_视频_对象_CVPR_2018年_paper.pdf
https://datascience.stackexchange.com/questions/28095
复制相似问题