首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >以一致性矩阵为相似矩阵的层次聚类

以一致性矩阵为相似矩阵的层次聚类
EN

Data Science用户
提问于 2021-02-27 14:02:28
回答 1查看 586关注 0票数 1

我正在关注关于programming中的共识集群的文章。在第7页中,作者指出:“协商一致矩阵很自然地被用作可视化工具,以帮助评估集群的组成和数量。特别是,如果我们将颜色梯度与0-1的实数范围相关联,使白色对应于0,而暗红色对应于1,如果我们假定矩阵的排列使属于同一集群的项目彼此相邻(使用相同的项目顺序来索引矩阵的行和列),那么对应于完美一致性的矩阵将在白色背景上显示为以红色块沿对角线描述的颜色编码热图。

一致性矩阵本身是一个(N×N)矩阵,它存储每对项目的聚类比例,其中两个项目聚在一起。通过取每个扰动数据集连通性矩阵的平均值,得到一致性矩阵。为了从一致矩阵到可视化,作者指出:“我们可以利用一致矩阵本身来确定最优的项目顺序,特别是如果我们以一致矩阵作为相似矩阵进行层次聚类,诱导的树状图将其叶子排列,使具有最高一致性指数的项目彼此相邻,从而使热图的块对角线性质最大化,从而使热图的块对角性质最大化(必须再次强调,同样的项目顺序用于对矩阵的行和列进行索引)。”

我有我的共识矩阵,经过10次抽样和聚类我的数据集500项。协商一致矩阵如下:

其中1或0表示对10次抽样的聚类结果完全一致/一致。然而,我无法理解我们是如何完成上述可视化的。我有几个问题:

  1. 作者指出,我们使用一致性矩阵作为相似矩阵,但层次聚类不需要距离矩阵吗?例如,在AgglomerativeClustering的Python实现中,它说:“如果”预先计算“,需要一个距离矩阵(而不是相似性矩阵)作为fit方法的输入。”
  2. 作者用“再次强调同样的项目顺序用于索引矩阵的行和列”是什么意思?
EN

回答 1

Data Science用户

发布于 2021-02-28 15:39:19

为了回答你的两个问题:

  1. 聚类需要一个距离度量,但是您可以通过一致性-相似矩阵来计算这一点。最基本的方法,是这样做:distance_matrix = 1 / similarity matrix,尽管,他们可以在文件中明确说明他们为这个转换使用了什么功能。
  2. 我认为这仅仅是说矩阵是对称的。热图的x轴为n=0,1,2,3,4,热图的y轴为n=0,1,2,3,4.这是与相关矩阵相同的过程。只要保持你的矩阵,它就会维持这个秩序。
票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/90023

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档