我已经开始使用计算机视觉技术,主要是深度学习,但我想尝试更好地理解更传统的技术,以及良好的基础。我一直在尝试一些手动特征工程技术,用于使用RF和SVM分类器进行分类。我已经研究了纹理表示,如HOG和LBP描述符,以及边缘滤波器,gabor滤波器和空间特征,如傅立叶描述符。我所欠缺的是对不同功能如何分组以及它们各自属于什么类别的好主意。我知道有些被定义为全局和局部的,但是这到底是什么意思,是哪些呢?还有其他类别,比如纹理和几何,我应该考虑一下吗?任何解释都将是有用的和非常感激的(我在网上看了很多,但似乎都有点零散)
谢谢!
发布于 2020-01-12 04:51:56
特征是从图像中提取的人类难以理解和关联的数值信息。假设我们将图像视为数据,从数据中提取的信息称为特征。通常,从图像中提取的特征比原始图像的维度要低得多。维数的降低减少了处理图像簇的开销。
基本上,根据应用程序从图像中提取两种类型的特征。它们是局部和全局特征。功能有时被称为描述符。全局描述符通常用于图像检索、对象检测和分类,而局部描述符用于对象识别/识别。检测和识别之间有很大的区别。检测是找出某物/物体的存在(找出一个物体是否存在于图像/视频中),而识别是找出物体的身份(识别一个人/物体)。
全局特征描述图像作为一个整体来概括整个对象,其中局部特征描述对象的图像块(图像中的关键点)。全局特征包括轮廓表示、形状描述符和纹理特征,局部特征表示图像块中的纹理。形状矩阵、不变矩(Hu,Zerinke)、面向直方图的梯度(HOG)和Co-HOG是全局描述符的一些示例。SIFT、SURF、LBP、BRISK、MSER和FREAK是局部描述符的一些示例。
通常,对于诸如对象检测和分类之类的低级应用,使用全局特征,而对于诸如对象识别之类的较高层应用,使用局部特征。全局特征和局部特征的结合提高了识别的准确性,同时也带来了计算开销的副作用。
https://stackoverflow.com/questions/59684368
复制相似问题