首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >WEKA K-Means聚类

WEKA K-Means聚类
EN

Stack Overflow用户
提问于 2011-04-26 22:09:34
回答 4查看 18.4K关注 0票数 8

有人能解释一下WEKA中K-Means聚类的输出是什么意思吗?

例如

代码语言:javascript
复制
kMeans


Number of iterations: 9

Within cluster sum of squared errors: 9434.911100488926

Missing values globally replaced with mean/mode

Cluster centroids:

                  Cluster#
Attribute         Full Data          0          1                           
                      (400)      (310)       (90)
=================================================
competency134        0.0425     0.0548          0  
competency207        0.0425     0.0548          0  
competency263          0.01     0.0129          0  
competency264          0.01     0.0129          0  
competency282          0.01     0.0129          0  
competency289          0.01     0.0129          0  

列中的数字实际上是什么意思,它说的是表上方的集群质心,但如何确定两个集群的质心是什么呢?

如果有人能解释这些数字的含义,我将不胜感激。

如果任何人有任何想法,如何完成集群的剪影评估发现,这也是很好的。

谢谢

EN

回答 4

Stack Overflow用户

发布于 2011-05-16 15:18:59

第一列给出了总体人口质心。第二列和第三列分别提供了簇0和簇1的质心。每一行都给出了特定尺寸的质心坐标。

我相信你需要复习一下你的K-means。找到质心是该算法的重要组成部分。质心是算法特定运行的结果,并且不是唯一的-不同的运行可能会生成不同的质心集。

更多详情请查看Michael Abernethy's description of Weka clustering

票数 4
EN

Stack Overflow用户

发布于 2013-01-13 10:39:02

这只是第一步

  1. 将可视化选项卡中的绘图另存为arff文件。
  2. 使用weka打开它并单击编辑,您将自动看到每个实例所属的集群。
  3. 将此表复制到excel (为了更容易可视化)
  4. 使用excel或matlab使用经典方法查找竖线、内聚、分隔。
票数 4
EN

Stack Overflow用户

发布于 2014-08-17 09:59:03

首先,聚类是一种描述性的统计方法。其次,算法Kmeans需要预先输入聚类个数,找出最佳聚类个数,采用几种统计方法。第三,数值数据的质心是数据的算术平均值,这使得这些数据表示组数据的clusters.So。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5791583

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档