我在130 K行(130 K唯一键)和7列的数据集上运行聚集群集,每个列的级别从20到2000不等。这些数据是分类的,特别是字母数字代码。最多可以把它们看作是因素。我正在试验从k模式的几个替代方案中得到什么结果,包括分层聚类和MCA。
我的问题是,有什么好的方法将结果可视化到一定的层次与树结构吗?
标准步骤不是问题:
library{cluster}现在开始策划。下面的行文行得通,但情节是人类无法读懂的
plot(aggl.clust.c, main = "Agglomerative, complete linkages")理想情况下,我要寻找的是这样的东西(下面是在我的系统上失败的伪代码)
plot(cutree(aggl.clust.c, k=7), main = "Agglomerative, complete linkages")我正在运行R版本3.2.3。这个版本是不能改变的(我不认为它会对我想要做的事情产生影响)。
如果有人有好的指针,我也有兴趣在Python中做同样的事情。
发布于 2019-07-11 16:02:04
我找到了一个有用的答案来回答我的问题,用as.dendogram()方法重新绘制树的一部分。链接:http://www.sthda.com/english/wiki/beautiful-dendrogram-visualizations-in-r-5-must-known-methods-unsupervised-machine-learning
https://stackoverflow.com/questions/56858063
复制相似问题