我有一个矩阵x (30x2000)的2000基因表达在不同的细胞系和一个载体y (30x1)的连续可变的结果。我想要计算每个基因和结果之间的Pearson相关性,所以,我期望有一个2000 x1的r值向量。我使用过rcorr(x,y),但是结果是一个2000x2000矩阵,所以我猜它忽略了y,并计算了所有的基因(手册上说:
X=至少有5行和至少2列的数字矩阵(如果y不存在)
但是,我可以有多个列,也可以有y吗?我需要使用不同的功能吗?
发布于 2013-09-25 09:27:26
您需要跨apply cor函数跨x矩阵的列.
apply( x , 2 , cor , y = y )可复制的例子
# For reproducible data
set.seed(1)
# 3 x 4 matrix
x <- matrix( runif(12) , nrow = 3 )
# [,1] [,2] [,3] [,4]
#[1,] 0.2655087 0.9082078 0.9446753 0.06178627
#[2,] 0.3721239 0.2016819 0.6607978 0.20597457
#[3,] 0.5728534 0.8983897 0.6291140 0.17655675
# Length 3 vector
y <- runif(3)
#[1] 0.6870228 0.3841037 0.7698414
# Length 4 otuput vector
apply( x , 2 , cor , y = y )
#[1] 0.3712437 0.9764443 0.2249998 -0.4903723发布于 2013-09-25 11:29:03
使用函数cor就可以了。通常,如果x是MxN安迪y是MxP,那么cor(x,y)将是一个NxP矩阵,其中条目(i,j)是x[,i]和y[,j]之间的关联。
基于SimonO101 101的可复制示例:
> set.seed(1)
> x <- matrix( runif(12) , nrow = 3 )
> y <- runif(3)
> cor(x,y)
[,1]
[1,] 0.3712437
[2,] 0.9764443
[3,] 0.2249998
[4,] -0.4903723如果你只想要一个向量而不是矩阵:
> array(cor(x,y))
[1] 0.3712437 0.9764443 0.2249998 -0.4903723https://stackoverflow.com/questions/19000557
复制相似问题