我倾向于用HSV作为特征来表示每个像素,然后我可以使用包字模型来做进一步的处理,如分类。
我从paper1上读到的
每个区域使用其像素的HSV值的多元直方图建模,其中H通道使用8个桶,每个S和V通道使用3个桶,从而生成一个72维特征向量。
我知道使用matlab或python来获取图像的颜色空间很容易,但我混淆了如何像上面描述的那样获得一个72昏暗的特征向量。任何现有的代码都可以做到这一点(更好的matlab)?
1:使用区域袋表示的场景分类,CVPR 07
发布于 2014-07-15 09:52:55
由第8、3和3维的3个子矢量组成的72维向量意味着:
对于通常给出360度值的色调颜色空间,您可以将其量化为8个桶。这就是360/8 = 45 / bin:0-45获取值、0、46-90、获取值、1等等。
类似地,对于饱和(通常获取值0-1)和值(0-1)意味着每个bin获取值:1/3 = 0.3333。0-0.333得到值0,0.334-0.666得到值1,等等。
最后,将它们连在一起,得到一个72模糊的矢量。
https://stackoverflow.com/questions/24753801
复制相似问题