我试图使用二进制数据进行分层聚类分析,对于距离矩阵,我应用了来自素食包的函数vegdist():
dist.jac <- vegdist(final_df, method="jaccard", binary = TRUE)接下来,我使用了hclust函数,但我不确定是否应该使用vegdist()生成的不同矩阵
jac <- hclust(dist.jac, method = "ward.D")或者尝试这样的东西(就像我看到的):
jac <- hclust(dist(dist.jac), method = "ward.D")因为函数hclust()需要“由dist生成的不同的结构”。但另一方面,纯素包说,“应该提供dist的插入替代,并返回相同类型的距离对象”和“函数是dist的替代品”。应用dist(dist.jac)对我来说没有多大意义,但我已经见过了,所以如果有人能向我解释我应该使用哪一个,我会非常感激的!
发布于 2020-11-13 15:48:04
如果有人在做dist(dist.jac),他们得到的是数据的不同,而不是数据的不同。这很少有意义。
就像纯素食文档所说的那样,vegdist是dist的替代品。你用哪一种并不重要。如果只有一种选择可以使用不同的方法,请使用该方法。如果两者都可用,请使用其中之一。在这种情况下,我个人更喜欢dist,因为它不需要调用任何贡献包。
https://stackoverflow.com/questions/64594402
复制相似问题