文章/答案/技术大牛

发布

社区首页 >问答首页 >在R中执行大量的2样本t检验

问在R中执行大量的2样本t检验
EN

Stack Overflow用户

提问于 2020-03-13 21:34:05

回答 2查看 146关注 0票数 1

因此，我正在创建一个函数，它允许我获取一个data.frame，并为每个测试变量获取p.values的数据。

    # data and labels
my_data <- data.frame(matrix(data = rnorm(10000), nrow = 100, ncol = 10000))
labels <- sample(0:1, 100, replace = TRUE)


# append the labels to the data, then filter
my_data$labels <- labels

sample_1 <- dplyr::filter(.data = my_data, labels == 0)
sample_2 <- dplyr::filter(.data = my_data, labels == 1)


#perform a t-test on each column
p_vals <- data.frame()
for(i in c(1:10000)) {
    p_vals <- rbind(p_vals, t.test(x = sample_1[,i], y = sample_2[,i])$p.value)
}

return(p_vals)

这是功能性的，但是我认为/希望在不使用for循环的情况下有一种更有效的方法来完成这个任务。数据应该是行的，因为对于以后的函数来说，重要的是跟踪哪个变量有哪个p值。

dplyr

statistics

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-03-13 22:07:29

您可以使用t.test的公式接口和my_data列上的sapply来执行测试，而不是分割示例：

p_vals <- sapply( my_data, function(x) t.test(x ~ labels)$p.value )

这将生成p-值的向量，其顺序将与my_data的列相同。

票数 2

Stack Overflow用户

发布于 2020-03-13 22:33:45

您还可以使用包genefilter：

library(genefilter)
colttests(as.matrix(my_data[,-ncol(my_data)]),factor(my_data$labels))

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60677482

复制

相似问题

问在R中执行大量的2样本t检验
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在R中执行大量的2样本t检验EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在R中执行大量的2样本t检验
EN