首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用ggpairs获取相关值

使用ggpairs获取相关值
EN

Stack Overflow用户
提问于 2020-08-10 22:51:56
回答 1查看 825关注 0票数 0

我使用ggpairs获得了以下情节:

我想知道哪一对有最大的绝对相关性。然而,当一些配对,如能量跨度、能量长度、跨度等被情节覆盖时,我该如何确定呢?另外,是否有一种更容易的方法来查看相关性(以文本格式),而不是必须通过图像查看它们?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-08-10 23:07:03

PowerSpan的相关系数与SpanPower的相关系数相同。相关系数是根据各点与最佳拟合线之间的平方差之和计算的,因此,哪个序列在哪个轴上并不重要。因此,您可以读取右上角的相关系数,并在左下角看到散点图。

cor函数返回两个向量之间的相关系数。命令不重要。

代码语言:javascript
复制
set.seed(123)
x <- runif(100)
y <- rnorm(100)
cor(x, y)
[1] 0.05564807
cor(y, x)
[1] 0.05564807

如果您将一个data.frame (或类似的)提供给cor(),您将得到每一对变量之间相关系数的相关矩阵。

代码语言:javascript
复制
set.seed(123)
df <- data.frame(x= rnorm(100), 
                 y= runif(100), 
                 z= rpois(100, 1), 
                 w= rbinom(100, 1, .5))
cor(df)
            x           y          z           w
x  1.00000000  0.05564807 0.13071975 -0.14978770
y  0.05564807  1.00000000 0.09039201 -0.09250531
z  0.13071975  0.09039201 1.00000000  0.11929637
w -0.14978770 -0.09250531 0.11929637  1.00000000

你可以在这个矩阵中看到对角线周围的对称性。

如果要以编程方式识别最大(非统一)相关系数,可以执行以下操作:

代码语言:javascript
复制
library(dplyr)
library(tidyr)
cor(df) %>%
  as_data_frame(rownames = "var1") %>%
    pivot_longer(cols = -var1, names_to = "var2", values_to = "coeff") %>%
    filter(var1 != var2) %>%
    arrange(desc(abs(coeff)))
# A tibble: 12 x 3
  var1  var2    coeff
  <chr> <chr>   <dbl>
 1 x     w     -0.150 
 2 w     x     -0.150 
 3 x     z      0.131 
 4 z     x      0.131 
 5 z     w      0.119 
 6 w     z      0.119 
 7 y     w     -0.0925
 8 w     y     -0.0925
 9 y     z      0.0904
10 z     y      0.0904
11 x     y      0.0556
12 y     x      0.0556
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63349091

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档