据我所知,CNN依靠滑动窗口技术,只能指出某一模式是否存在于给定的包围框中。这是真的吗?
如果没有这些技术的帮助,一个人能用CNN来实现本土化吗?
发布于 2015-01-28 14:06:07
这是图像识别中一个开放的问题。除了滑动窗口外,现有的方法还包括预测目标在图像中的位置作为CNN输出,预测边界(分类像素是否属于图像边界)等。例如,请参阅本论文和其中的引用。
还请注意,CNN使用最大池,可以识别有助于目标识别的特征检测器的位置,并使用它来建议可能的目标位置区域。
发布于 2017-07-18 17:54:58
最近有一些技术来定位CNN中的对象。参见本文paper.pdf。
它使用一个名为“全球平均池”(GAP)的层,不需要额外的工作,CNN就可以定位它识别的对象。
也请查看这篇非常好的博客文章:https://alexisbcook.github.io/2017/global-average-pooling-layers-for-object-localization/
https://stackoverflow.com/questions/28178054
复制相似问题