首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >集群分析-寻找集群的中心

集群分析-寻找集群的中心
EN

Stack Overflow用户
提问于 2013-04-04 21:25:54
回答 2查看 262关注 0票数 0

我已经创建了两个聚类算法: k-means和divisive,也许稍后我还会添加aglomerative。我必须分析它们在高维数据中的表现如何,为此,我必须计算到集群中心的平均/总和距离。在k-means的情况下,这很容易,我有质心,但是如何在除法/聚类法中找到中心呢?当我在这里的时候:我目前已经实现了Euclede距离,曼哈顿距离和皮尔逊距离,还有其他距离度量我可以使用吗?提前感谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-04-06 18:19:56

我的工作目标是分析这些集群,当他们必须从高维数据创建集群时。很难对它们进行评估,而且结果不太可能完全公平,所以我将使用一个集群中记录之间的平均累积距离,以及来自不同集群的两个记录之间的最小距离。关于如何在分层聚类算法中找到聚类中心的方法-与k-means中使用的公式相同,用于在每次迭代后重新计算质心。

票数 0
EN

Stack Overflow用户

发布于 2013-04-05 03:58:20

你可能想要这本书:

  • 距离百科全书,米歇尔·德扎,埃琳娜·德扎,590页。

它涵盖了许多您可以使用的备用距离函数。

可能有几百个不同的距离 ...

然而,你还需要研究你的评估方法--如果它是基于质心的,它将偏向k-means。因此,这种比较可能是不公平的。

此外,如果您使用人工数据,请确保您不会不公平地偏爱一种方法而不是另一种方法,因为该方法与您生成数据的方式相关(例如,如果您生成高斯聚类,它会偏爱k-means等方法)。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15812609

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档