我正在研究Viola-Jones的论文,以便更好地理解他们的目标检测算法,并制作一个适用的程序。在特征主题的最后一段中,作者讨论了检测器的基本分辨率是24x24,他们说矩形特征的穷举集相当大,超过18万。请注意,与Haar基不同,矩形特征集是过完备的。这是否意味着每个矩形特征都是24*24,或者它只是意味着我们将给定的图像划分为24*24个块? 180000是为每24 * 24个块找到几种类似Haar的特征的结果吗?我也不能理解最后的部分,它说明矩形特征集是过度完整的。当我们谈论矩形特征时,过度完备意味着什么?谢谢。
发布于 2016-08-05 14:17:56
每个24X24矩形特征只给出一个数字,如前面在同一段落中所述:“两个矩形特征的值是两个矩形区域内像素之和的差”和“三个矩形特征计算两个外部矩形内的和减去一个中心矩形的和。最后一个四个矩形特征计算对角线上的矩形对之间的差异。”
有关数字180,00的说明,请参阅:Viola-Jones' face detection claims 180k features
过完备集意味着你有一些特征是其他特征的线性组合。在24X24矩形特征的情况下,我们可以通过在其中一个正方形中取值为1的所有矩形,在所有其他正方形中取值为0的所有矩形,为该空间构建一个线性基数。如果我们计算此配置有多少个选项,我们得到的24*24=576远远小于180,000。这意味着,从他们的180,000个集合中,我们可以获得一些矩形,这些矩形可以作为集合中其他矩形的组合。
https://stackoverflow.com/questions/38748801
复制相似问题