我一直在阅读这文章中关于协商一致聚类和协商一致矩阵的内容。我理解在对数据的某些部分进行重新采样和聚类H次之后,如何建立共识矩阵。我了解到,协商一致矩阵用于确定簇(k)的最佳数量,并允许生成一个很好的热图。我不明白的是,这个协商一致的矩阵是如何导致最终的聚类的。
假设我有一个协商一致矩阵4*4 (因此我们有4项要聚类),其中矩阵中0到1之间的每个值表示将项目i和j分配到同一个集群的次数,除以两个项被选择进行聚类的总次数。经过4次迭代80%的子样本(取自这里),我们可以得到以下的一致性矩阵。我们跟踪了在获得这一协商一致矩阵的过程中形成的所有4组。我们如何根据这个共识矩阵选择最终的聚类?
发布于 2021-02-26 11:06:27
共识聚类是一种额外的评估技术(即集群之间有多少共识),比如剪影评分,而不是显式集群。
簇本身在处理过程中会提前退出。在K-均值聚类算法中,使用一致性度量来检验最佳K值.
https://datascience.stackexchange.com/questions/89967
相似问题