下面是我的数据的一个子集(数据集)。它总结了用不同药物处理细胞后的细胞活性(实际数据集有1200种药物)。实验一式三份(samples1、2和3)。为了简单起见,我生成了一个小数据集,如下所示:
sample_01 sample02 sample03
untreated 100 120 110
drug1 50 49 48
drug2 90 87 80
drug3 40 43 42我想对未处理的细胞存活率值与我使用的每种药物进行t检验。
我尝试使用for循环,但它不起作用:
for (i in 1:nrow(dataset)) {
x = dataset["untreated",]
y = dataset[i,]
result<-t.test(x,y)
}发布于 2018-06-08 20:38:13
以下是你的帖子中的数据集示例:
dataset <- data.frame(sample_01=c(100,50,90,40),
sample_02=c(120,49,87,43),
sample_02=c(110,48,80,42)
)
rownames(dataset) <- c("untreated", "drug1", "drug2", "drug3")你的循环看起来很好,只需要做两处修改:
首先,您应该从2开始循环,而不是从1开始,因为您不想将第一行与其本身进行比较(未处理)。
第二,你应该把你的结果存储在一个列表中,而不是覆盖一个叫做" results“的变量,因为这样你每次都会在一个循环中重写它,最后只会得到最后一行的答案。
修改如下:
results <- list()
for (i in 2:nrow(dataset)) {
x <- dataset["untreated",]
y <- dataset[i,]
results[[i-1]] <- t.test(x,y)
}现在,您可以获得p值:
> sapply(results, getElement, "p.value")
[1] 0.008337497 0.033407617 0.006107201或者,为了让事情变得更简单,您可以考虑使用包:
library(matrixTests)
> row_t_welch(dataset[-1,], dataset["untreated",])
obs.x obs.y obs.tot mean.x mean.y mean.diff var.x var.y stderr df statistic pvalue conf.low conf.high alternative mean.null conf.level
drug1 3 3 6 49.00000 110 -61.00000 1.000000 100 5.802298 2.039996 -10.513075 0.008337497 -85.50204 -36.497961 two.sided 0 0.95
drug2 3 3 6 85.66667 110 -24.33333 26.333333 100 6.489307 2.985027 -3.749758 0.033407617 -45.04393 -3.622734 two.sided 0 0.95
drug3 3 3 6 41.66667 110 -68.33333 2.333333 100 5.840472 2.093283 -11.699968 0.006107201 -92.41964 -44.247023 two.sided 0 0.95https://stackoverflow.com/questions/50649238
复制相似问题