文章/答案/技术大牛

发布

社区首页 >问答首页 >找到最佳聚类数(在分层聚类中)

问找到最佳聚类数(在分层聚类中)
EN

Stack Overflow用户

提问于 2018-08-21 04:17:09

回答 1查看 802关注 0票数 0

我正在尝试用SPSS做聚类分析。在R中，我们可以使用轮廓图来确定最佳聚类数。

如何使用SPSS找到最优聚类数？

PS。我是第一次接触SPSS。

spss

hierarchical-clustering

回答 1

Stack Overflow用户

发布于 2018-08-22 13:31:22

您可以使用STATS CLUS SIL命令来生成轮廓图和分数，如果这是您特别想要的。

主要使用默认值的示例语法可能如下所示：

STATS CLUS SIL
 CLUSTER=clus_var /* var w cluster classifications */
 VARIABLES=pred_var1 TO pred_var10 /* vars used to form clusters */
 NEXTBEST=nb_clus_var /* output var. holds next best classifications */
 SILHOUETTE=s_value /* output var. holds silhouette scores */
 DISSIMILARITY=EUCLID /* make sure this matches measure in kmeans */
 MINKOWSKIPOWER=2
 /OPTIONS MISSING=RESCALE RENUMBERORDINAL=NO
 /OUTPUT HISTOGRAM=YES ORIENTATION=HORIZONTAL THREEDBAR=YES THREEDCOUNTS=NO .

可能有帮助的链接：

IBM: Using the silhouette procedure to evaluate kmeans

stackoverflow: How to visualize the effect of running means algorithm in SPSS

Stats.StackExchange: How to Calculate silhouette coefficient in SPSS for clustered data set?

另外，您还可以考虑将DISCRIMINANT命令作为评估集群独特性的另一种工具。

DISCRIMINANT
 /GROUPS=clus_var4 (1 4) /* assumes 4 cluster classifications */
 /VARIABLES=pred_var1 TO pred_var10 /* vars used to form clusters */
 /ANAL all
 /METHOD = MAHAL
 /PRIORS SIZE
 /HISTORY = STEP
 /ROTATE struct
 /STATISTICS = CROSSVALID COEFF
 /CLASSIFY = NONMISSING POOLED .

您可以查看输出的分类统计数据(交叉验证)，以了解预测的集群分类与实际分类匹配的频率。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51937942

复制

相似问题

问找到最佳聚类数(在分层聚类中)
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问找到最佳聚类数(在分层聚类中)EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问找到最佳聚类数(在分层聚类中)
EN