我有一个关于使用R语言进行分层聚类的问题。我试图找出dist.metric对函数hclust的参数值。我想知道这是否与Python的“度量”相同,但显然我试图在那里使用“余弦”,结果是一个错误。那么这个论点所接受的价值是什么呢?如果可能的话,提供一个例子。
发布于 2022-05-05 12:47:56
您可以在hclust函数中使用不同的度量:
是采用的团聚方法。这应该是"ward.D“、"ward.D2”、“单”、“完整”、“平均”(= UPGMA)、"mcquitty“(= WPGMA)、”中位数“(= WPGMC)或”质心“(= UPGMC)的缩写。
这意味着您可以使用例如average。下面是一个示例:
data <- matrix(rnorm(100), nrow=3)
d_m = dist(data, method="maximum")
hclust(d_m, method="average")
Call:
hclust(d = d_m, method = "average")
Cluster method : average
Distance : maximum
Number of objects: 3 如您所见,cosine不可用。
在dist.metric中使用hclust时
hclust(d_m, method="average", dist.metric = "cosine")
Error in hclust(d_m, method = "average", dist.metric = "cosine") :
unused argument (dist.metric = "cosine")因此,没有一个叫做dist.metric的论点。
https://stackoverflow.com/questions/72126583
复制相似问题