作为我探索工作的一部分,我构建了一个函数,它为数据集中的每个字段提供了各种度量标准。我想将它应用于数据集的每一列。
library(tidyverse)
mtcars %>%summarise_all(., .funs = funs(mean, median, sd, max, min, n_distinct))但是,这将生成一个1行的数据集,并将每个函数/列组合为一个列。这些名称也被连在一起,如'column_function‘。
期望的结果将是一种“整洁”格式,如:
ORIGINAL_COLUMN_NAME _~_函数_
我猜一定有个简单的方法?
发布于 2018-04-09 05:21:35
这里有一个选择。
library(tidyverse)
mtcars %>%
gather(Original_Column, Value) %>%
group_by(Original_Column) %>%
summarise_all(., .funs = funs(mean, median, sd, max, min, n_distinct)) %>%
gather(Function, Result, -Original_Column)
# # A tibble: 66 x 3
# Original_Column Function Result
# <chr> <chr> <dbl>
# 1 am mean 0.406
# 2 carb mean 2.81
# 3 cyl mean 6.19
# 4 disp mean 231.
# 5 drat mean 3.60
# 6 gear mean 3.69
# 7 hp mean 147.
# 8 mpg mean 20.1
# 9 qsec mean 17.8
# 10 vs mean 0.438
# # ... with 56 more rowshttps://stackoverflow.com/questions/49725931
复制相似问题