我正在关注关于programming中的共识集群的这文章。在第7页中,作者指出:“协商一致矩阵很自然地被用作可视化工具,以帮助评估集群的组成和数量。特别是,如果我们将颜色梯度与0-1的实数范围相关联,使白色对应于0,而暗红色对应于1,如果我们假定矩阵的排列使属于同一集群的项目彼此相邻(使用相同的项目顺序来索引矩阵的行和列),那么对应于完美一致性的矩阵将在白色背景上显示为以红色块沿对角线描述的颜色编码热图。

一致性矩阵本身是一个(N×N)矩阵,它存储每对项目的聚类比例,其中两个项目聚在一起。通过取每个扰动数据集连通性矩阵的平均值,得到一致性矩阵。为了从一致矩阵到可视化,作者指出:“我们可以利用一致矩阵本身来确定最优的项目顺序,特别是如果我们以一致矩阵作为相似矩阵进行层次聚类,诱导的树状图将其叶子排列,使具有最高一致性指数的项目彼此相邻,从而使热图的块对角线性质最大化,从而使热图的块对角性质最大化(必须再次强调,同样的项目顺序用于对矩阵的行和列进行索引)。”
我有我的共识矩阵,经过10次抽样和聚类我的数据集500项。协商一致矩阵如下:

其中1或0表示对10次抽样的聚类结果完全一致/一致。然而,我无法理解我们是如何完成上述可视化的。我有几个问题:
发布于 2021-02-28 15:39:19
为了回答你的两个问题:
distance_matrix = 1 / similarity matrix,尽管,他们可以在文件中明确说明他们为这个转换使用了什么功能。n=0,1,2,3,4,热图的y轴为n=0,1,2,3,4.这是与相关矩阵相同的过程。只要保持你的矩阵,它就会维持这个秩序。https://datascience.stackexchange.com/questions/90023
复制相似问题