所以,我想从驾驶员记录器记录的视频中检测汽车。我读了很多书,做了很多研究,但还是不太明白。我确实考虑使用线性支持向量机的HOG描述符。但是,既然这对我来说是一种研究,那么它还能以什么方式改进,使其更容易实现和更健壮呢?我正在考虑将另一种技术/算法与HOG相结合,但仍有些迷茫。在这方面我还是个新手。
任何帮助都是非常感谢的。我也对其他更好的想法持开放态度。
发布于 2016-04-21 08:39:51
HOG (定向梯度直方图)只是一种特定类型的特征向量,可以从数据中计算出来。您计算图像中每个像素的梯度向量,然后将可能的角度划分为离散数量的框。在给定的图像子区域中,添加指向给定方向的渐变的总幅度,作为包含该方向的相关角度框的条目。
这样就得到了一个长度等于您选择的用于划分角度范围的柱状图的向量,并充当一个非标准化直方图。
如果您想要计算同一个子区域的其他图像特征,例如像素的总和、对锐角或线的一些度量、颜色分布的各个方面等等,您可以根据需要计算任意多个或任意少个图像特征,也可以将它们排列为一个长向量,然后将该特征向量与HOG向量连接起来。
您可能还希望重复计算多个不同比例级别的HOG向量,以帮助捕获一些比例可变性,将每个特定于比例的HOG向量连接到整体特征向量。还有其他特征概念,如SIFT和其他,创建这些概念是为了自动说明比例不变性。
您可能需要进行一些标准化或缩放,您可以在任何标准的SVM指南中了解到这一点。标准LIBSVM guide是一个很好的起点。
您必须小心正确地组织您的特征向量,因为您可能会有非常多的组件到特征向量,您必须确保它们始终计算和放置在相同的顺序,并经历完全相同的缩放或归一化处理。
https://stackoverflow.com/questions/36757492
复制相似问题