我已经使用在OpenCV中使用C++进行了集群化,并有12个集群中心(每个中心有200个维度)。
现在,我有一组200维的点,我正在试图找到最近的集群(向量量化)。
哪种距离比另一种更好(Mahalanobis距离或欧几里得距离)?目前我使用的是欧几里德距离。
发布于 2012-02-24 09:23:36
Andrey's point是有效的。我可以补充一项一般性声明:
对于Mahalanobis距离,您需要能够正确地估计每个集群的协方差矩阵。对于200维,唯一能对协方差矩阵簇进行合理估计的方法是使用几百到数千个数据点。再加上您拥有的12个集群,您很容易需要数万个数据点才能合理地使用Mahalanobis距离。
除此之外:试试欧几里得距离是如何为你工作的。如果结果是合理的,坚持这一点,否则试试马哈拉诺比。
最后,您可能会在stats stackexchange上找到更多关于这一主题的知识丰富的人。
发布于 2012-02-23 22:06:14
如果不了解具体情况,就不可能回答这个问题。没有好的或坏的度量,每一个都更适合于特定类别的问题。
https://stackoverflow.com/questions/9421627
复制相似问题