tl;博士
如何从多列上的乘法拆分中生成“分区”?
动机:
我不喜欢使用32个核心中的一个进行辛勤工作总结,所以我尝试使用多机 --我在多个列上操作。
示例:
vignette显示按单个列分组,但当我这样做时,不考虑我的另一个分组列。
代码:
library(dplyr)
library(multidplyr)
library(nycflights13)
flights1 <- partition(flights, flight)
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)那么分年、分月和分日怎么样?
这对我不起作用:
flights1 <- partition(flights, list(year, month, day))
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)我似乎做不到这件事。你能指出一个正确的或至少有效的方法来做到这一点吗?
发布于 2017-12-21 23:01:20
根据?partition的说法,partition的用法是
partition(.data, ..., cluster = get_default_cluster())
其中...是要分区的变量。与其传递变量列表,不如分别传入每个变量,即
partition(flights, year, month, day)https://stackoverflow.com/questions/47928910
复制相似问题