有人能解释一下WEKA中K-Means聚类的输出是什么意思吗?
例如
kMeans
Number of iterations: 9
Within cluster sum of squared errors: 9434.911100488926
Missing values globally replaced with mean/mode
Cluster centroids:
Cluster#
Attribute Full Data 0 1
(400) (310) (90)
=================================================
competency134 0.0425 0.0548 0
competency207 0.0425 0.0548 0
competency263 0.01 0.0129 0
competency264 0.01 0.0129 0
competency282 0.01 0.0129 0
competency289 0.01 0.0129 0 列中的数字实际上是什么意思,它说的是表上方的集群质心,但如何确定两个集群的质心是什么呢?
如果有人能解释这些数字的含义,我将不胜感激。
如果任何人有任何想法,如何完成集群的剪影评估发现,这也是很好的。
谢谢
发布于 2011-05-16 15:18:59
第一列给出了总体人口质心。第二列和第三列分别提供了簇0和簇1的质心。每一行都给出了特定尺寸的质心坐标。
我相信你需要复习一下你的K-means。找到质心是该算法的重要组成部分。质心是算法特定运行的结果,并且不是唯一的-不同的运行可能会生成不同的质心集。
更多详情请查看Michael Abernethy's description of Weka clustering。
发布于 2013-01-13 10:39:02
这只是第一步
发布于 2014-08-17 09:59:03
首先,聚类是一种描述性的统计方法。其次,算法Kmeans需要预先输入聚类个数,找出最佳聚类个数,采用几种统计方法。第三,数值数据的质心是数据的算术平均值,这使得这些数据表示组数据的clusters.So。
https://stackoverflow.com/questions/5791583
复制相似问题