首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用R检测目标?

用R检测目标?
EN

Stack Overflow用户
提问于 2017-04-13 22:36:34
回答 2查看 7.7K关注 0票数 5

有线电视新闻网实际上是做什么的?是否就像使用CNN提取的特征来检测指定窗口区域中的类?对此有任何tensorflow实现吗?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-04-14 06:37:01

美国有线电视新闻网正在使用以下算法:

  1. 获取用于对象检测的区域建议(使用选择性搜索)。
  2. 对于每个区域,从图像中对区域进行裁剪,并对其进行彻底的CNN分类。

有更先进的算法,建立在此基础上,如快速R和更快的R.

fast-:

  1. 通过CNN播放整个图像
  2. 对于来自区域的每个区域,建议使用"roi轮询“层提取区域,然后对对象进行分类。

更快的R-CNN:

  1. 通过CNN播放整个图像
  2. 使用使用CNN检测到的特征,查找区域提案,使用对象建议网络。
  3. 对于每个对象方案,使用"roi轮询“层提取区域,然后对对象进行分类。

有很多植入在tensorflow,特别是更快的recent,这是最近的变体,只是谷歌更快的recent。

祝好运

票数 8
EN

Stack Overflow用户

发布于 2017-11-09 12:49:14

R-CNN是所有上述算法的爸爸算法,它为研究者在此基础上构建更复杂、更好的算法提供了途径。我想解释一下trying和其他变体。

R-CNN,或基于区域的卷积神经网络

R由三个简单的步骤组成:

  • 使用一种称为选择性搜索的算法扫描输入图像以寻找可能的对象,生成~2000区域提案。
  • 在每个区域建议的基础上运行一个卷积神经网络(CNN)。
  • 获取每个CNN的输出,并将其输入a) SVM对区域进行分类,b)线性回归器来收紧对象的边界框(如果存在这样的对象)。

快速R-CNN:

Fast R-CNN立即被R跟踪。通过以下几点,Fast R-CNN更快更好:

  • 在提出区域之前对图像执行特征提取,从而只对整个图像运行一个CNN,而不是2000年CNN在2000多个重叠区域上运行
  • 用softmax层代替支持向量机,从而扩展神经网络进行预测,而不是建立新的模型。

从直觉上看,它有很大的意义,删除2000 conv层,而不是采取一次卷积,并在上面的盒子。

更快的R-CNN:

快速RPN的缺点之一是选择搜索速度慢,快速RPN引入了一种称为区域提议网络(RPN)的算法。

这是RPN的工作原理:

在初始CNN的最后一层,3x3滑动窗口在特征图上移动,并将其映射到每个滑动窗口位置的较低维(例如256-d),它根据k个固定比率锚框(默认边界框)生成多个可能的区域。

每个区域的提案包括:

  • 该地区的“客观”得分
  • 4坐标表示区域的边界框,换句话说,我们在我们的上一个特征图中查看每个位置,并考虑围绕它的k个不同的盒子:一个高的盒子,一个宽的盒子,一个大的盒子,等等。

对于每个框,我们输出是否认为它包含一个对象,以及该框的坐标是什么。这就是在一个滑动窗口位置上的样子:

2k分数表示“对象”上的每一个k个包围框的软最大概率。注意,尽管RPN输出包围框坐标,但它并不试图对任何潜在对象进行分类:它的唯一工作仍然是提议对象区域。如果锚盒的“客观性”得分超过某一阈值,则将该框的坐标作为区域建议传递。

一旦我们有了我们的区域提案,我们就直接把它们输入实质上是快速R-CNN的地方。我们添加了一个池层,一些完全连接的层,最后是一个softmax分类层和包围盒回归器。从某种意义上说,更快的RPN =RPN+快速RPN。

链接某些Tensorflow实现:

TF

https://github.com/CharlesShang/FastMaskRCNN

您可以找到很多Github的实现。

P.S.我从乔伊斯·徐媒体博客上借了很多资料。

票数 7
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43402760

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档