首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >scipy.cluster.hierarchy.linkage的返回值的含义是什么?

scipy.cluster.hierarchy.linkage的返回值的含义是什么?
EN

Stack Overflow用户
提问于 2016-06-08 20:38:33
回答 1查看 3.3K关注 0票数 6

假设我们有X矩阵如下:

代码语言:javascript
复制
[[9 0]
[1 4]
[2 3]
[8 5]]

然后,

代码语言:javascript
复制
from scipy.cluster.hierarchy import linkage
Z = linkage(X, method="ward")
print(Z)

返回矩阵如下:

代码语言:javascript
复制
[[  1.           2.           1.41421356   2.        ]
 [  0.           3.           5.09901951   2.        ]
 [  4.           5.          10.           4.        ]]

返回值的含义是什么?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-06-08 21:06:02

虽然这里有been answered before,但它是一个“读取文档”的答案。我认为稍微解释一下这些文档是有用的。

我们从医生那里读到:

由4矩阵Z返回(n−1)矩阵Z。在第一次迭代时,将指数为Zi、0和Zi的簇组合成簇n+ i,指数小于n的簇对应于n个原始观测值之一。子、0、1簇之间的距离由Zi,2,第四值Zi,3表示新形成的簇中原始观测的个数。

我认为令人困惑的部分是第一个n簇是单子(“原始观测”)。所以Z中的第一个值实际上是n+1‘簇。这是第一个将两个单子组合在一起的集群。

所以在你的例子中,Z是4+1‘的星系团。我们有

代码语言:javascript
复制
 Z[0] = [  1.           2.           1.41421356   2.        ]

前两个值告诉我们使用哪些集群创建集群Z,它们是cluster_1,单例1,4和cluster_2,单例2,3。

第三个值给出了集群之间的距离。我们可以验证sqrt((2-1)^2 +(3-4)^2)=1.41.

第四个值告诉我们集群Z中有多少个单子。

因此,看看最后一个集群,Z2,我们看到它结合了Z中的第一组和第一组,每个簇都包含两个唯一的单子,所以Z2,3 = 4。

票数 12
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37712465

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档