我的项目是关于预测乳腺癌的生物标志物。
我使用此函数给出一个2x2矩阵:
Table(gpl96)[1:10,1:4]我想用这个数据来表示GDS中的基因样本,并比较p值,以了解它是否为正态分布。
发布于 2013-03-16 21:30:48
t.test检验两个服从正态分布的样本之间是否存在位置差异。
要大致检查假设的正态性,您可以检查qqnorm的输出是否呈线性,或者将ks.test与估计观察值的参数结合使用*:
set.seed(1)
x1 <- rnorm(200,40,10) # should follow a normal distribution
ks.test(x1,"pnorm",mean=mean(x1),sd=sd(x1)) # p: 0.647 [qqnorm(x1) looks linear]
x2 <- rexp(200,10) # should *not* follow a normal distribution
ks.test(x2,"pnorm",mean=mean(x2),sd=sd(x2)) # p: 3.576e-05, [qqnorm(x2) seems curved]我不知道GEO的Table,但我建议您使用它的VALUE columns -and而不是任何2x2矩阵-作为t.test、qqnorm或ks.test的输入;也许您可以通过张贴head(Table(gpl96)[1:10,1:4])的输出来提供一些额外的数据说明。
(*在https://stat.ethz.ch/pipermail/r-help/2003-October/040692.html之后,它似乎也展示了更精致的Lilliefors测试。)
https://stackoverflow.com/questions/15448517
复制相似问题