我试图创建一个whisker包所期望的数据结构,但我似乎不知道如何从我的数据框架中创建该结构。假设我有以下数据框架:
library(dplyr)
existing_format <-
mtcars %>%
select(carb, gear, cyl) %>%
arrange(carb, gear, cyl) %>%
distinct() ...I希望从existing_format转到以下所需的格式(只显示desired_format列表的前两个元素):
desired_format <- list(
list(
carb = "1",
gear = list(
list(gear = "3", cyl = list(list(cyl = "4"), list(cyl = "6"))),
list(gear = "4", cyl = list(list(cyl = "4")))
)
),
list(
carb = "2",
gear = list(
list(gear = "3", cyl = list(list(cyl = "8"))),
list(gear = "4", cyl = list(list(cyl = "4"))),
list(gear = "5", cyl = list(list(cyl = "4")))
)
)
)我尝试过按carb和gear分组,然后使用tidyr::nest()创建嵌套的df,但什么也没做。有一点告诉我,whisker::iteratelist()或whisker::rowSplit()是前进的方向,但我无法弄清楚。
谢谢,克里斯
发布于 2017-12-13 22:18:07
在这种情况下,可能比它更灵活,但您可以执行递归拆分。
rsplit<-function(dd) {
col <- names(dd)[1]
dat <- dd[[1]]
xx <- lapply(unique(dat), function(x) {
z <- setNames(list(x), col)
if(ncol(dd)>1) {
z[[names(dd)[2]]] <- rsplit(dd[dat==x,-1, drop=FALSE])
}
z
})
xx
}
rsplit(existing_format)这将在所有列上拆分,并使用列标题中的名称。
发布于 2017-12-13 22:45:39
这是一种方法,对于n列不是一般的,但是它适用于3。
library(purrr)
library(magrittr)
library(dplyr)
output <- existing_format %>%
map_df(as.character) %>%
group_by(carb,gear) %>%
summarize_at("cyl",~lst(map(.,~lst(cyl = .x)))) %>%
mutate(gear = map2(.x = gear,.y = cyl,~lst(gear = .x,cyl = .y))) %>%
group_by(carb) %>%
summarize_at("gear",~lst(gear=.)) %$%
map2(.x = carb,.y = gear,~lst(carb = .x,gear = .y))
identical(output[1:2],desired_format) #TRUEhttps://stackoverflow.com/questions/47802545
复制相似问题