有没有一种方法可以指导dplyr在na.rm=TRUE中使用summarise_each?我想用summarise_each("mean")来表示变量的均值,但是我不知道如何指定它来忽略缺少的值。
发布于 2014-09-10 15:59:50
根据文档中的链接,您似乎可以使用funs(mean(., na.rm = TRUE))
library(dplyr)
by_species <- iris %>% group_by(Species)
by_species %>% summarise_each(funs(mean(., na.rm = TRUE)))发布于 2020-04-23 18:19:26
以mtcars数据集为例
library(dplyr)您可以始终使用summarise来避免冗长的语法:
mtcars %>%
group_by(cyl) %>%
summarise(mean_mpg = mean(mpg, na.rm=T),
sd_mpg = sd(mpg, na.rm = T))发布于 2020-07-31 00:30:38
dplyr中的summarise_at函数将汇总特定列中的数据集,并允许删除所应用的每个函数的NAs。取虹膜数据集,计算从Sepal.Length到Petal.Width变量的均值和中位数。
library(dplyr)
summarise_at(iris,vars(Sepal.Length:Petal.Width),funs(mean,median),na.rm=T)https://stackoverflow.com/questions/25759891
复制相似问题