文章/答案/技术大牛

发布

社区首页 >问答首页 >WEKA K-Means聚类

问WEKA K-Means聚类
EN

Stack Overflow用户

提问于 2011-04-26 22:09:34

回答 4查看 18.4K关注 0票数 8

有人能解释一下WEKA中K-Means聚类的输出是什么意思吗？

例如

kMeans


Number of iterations: 9

Within cluster sum of squared errors: 9434.911100488926

Missing values globally replaced with mean/mode

Cluster centroids:

                  Cluster#
Attribute         Full Data          0          1                           
                      (400)      (310)       (90)
=================================================
competency134        0.0425     0.0548          0  
competency207        0.0425     0.0548          0  
competency263          0.01     0.0129          0  
competency264          0.01     0.0129          0  
competency282          0.01     0.0129          0  
competency289          0.01     0.0129          0

列中的数字实际上是什么意思，它说的是表上方的集群质心，但如何确定两个集群的质心是什么呢？

如果有人能解释这些数字的含义，我将不胜感激。

如果任何人有任何想法，如何完成集群的剪影评估发现，这也是很好的。

谢谢

cluster-analysis

data-mining

weka

k-means

回答 4

Stack Overflow用户

发布于 2011-05-16 15:18:59

第一列给出了总体人口质心。第二列和第三列分别提供了簇0和簇1的质心。每一行都给出了特定尺寸的质心坐标。

我相信你需要复习一下你的K-means。找到质心是该算法的重要组成部分。质心是算法特定运行的结果，并且不是唯一的-不同的运行可能会生成不同的质心集。

更多详情请查看Michael Abernethy's description of Weka clustering。

票数 4

Stack Overflow用户

发布于 2013-01-13 10:39:02

这只是第一步

将可视化选项卡中的绘图另存为arff文件。
使用weka打开它并单击编辑，您将自动看到每个实例所属的集群。
将此表复制到excel (为了更容易可视化)
使用excel或matlab使用经典方法查找竖线、内聚、分隔。

票数 4

Stack Overflow用户

发布于 2014-08-17 09:59:03

首先，聚类是一种描述性的统计方法。其次，算法Kmeans需要预先输入聚类个数，找出最佳聚类个数，采用几种统计方法。第三，数值数据的质心是数据的算术平均值，这使得这些数据表示组数据的clusters.So。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/5791583

复制

相似问题

问WEKA K-Means聚类
EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问WEKA K-Means聚类EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问WEKA K-Means聚类
EN