我已经创建了两个聚类算法: k-means和divisive,也许稍后我还会添加aglomerative。我必须分析它们在高维数据中的表现如何,为此,我必须计算到集群中心的平均/总和距离。在k-means的情况下,这很容易,我有质心,但是如何在除法/聚类法中找到中心呢?当我在这里的时候:我目前已经实现了Euclede距离,曼哈顿距离和皮尔逊距离,还有其他距离度量我可以使用吗?提前感谢!
发布于 2013-04-06 18:19:56
我的工作目标是分析这些集群,当他们必须从高维数据创建集群时。很难对它们进行评估,而且结果不太可能完全公平,所以我将使用一个集群中记录之间的平均累积距离,以及来自不同集群的两个记录之间的最小距离。关于如何在分层聚类算法中找到聚类中心的方法-与k-means中使用的公式相同,用于在每次迭代后重新计算质心。
发布于 2013-04-05 03:58:20
你可能想要这本书:
它涵盖了许多您可以使用的备用距离函数。
可能有几百个不同的距离 ...
然而,你还需要研究你的评估方法--如果它是基于质心的,它将偏向k-means。因此,这种比较可能是不公平的。
此外,如果您使用人工数据,请确保您不会不公平地偏爱一种方法而不是另一种方法,因为该方法与您生成数据的方式相关(例如,如果您生成高斯聚类,它会偏爱k-means等方法)。
https://stackoverflow.com/questions/15812609
复制相似问题