问R:如何定义分区来使用2个或多个变量来划分组(multidplyr)
EN

Stack Overflow用户

提问于 2018-08-09 08:10:21

回答 1查看 129关注 0票数 1

我对multidplyr有意见。我的原始数据：

      warehouse quantity   stock_date flag_stock
1         a        1       2018-01-01     1
2         b        2       2018-01-01     0
3         a        0       2018-01-02     1 
4         a        2       2018-01-02     1
...

 cluster <- multidplyr::create_cluster(detectCores() - 1)
 set_default_cluster(cluster)

我希望使用multidplyr按仓库和date_add聚合数据：

warehouse.stock %>% 
multidplyr::partition(warehouse.stock, 
groups = c(warehouse, stock_date), cluster = cluster) %>% 
summarize(n = sum(quantity), disp = sum(flag_stock)) %>% 
collect()

但是，当我运行代码时，我得到了以下错误消息：

错误:所有分区vars都必须已经存在

谢谢!

回答 1

Stack Overflow用户

发布于 2018-08-09 08:20:45

分组变量必须位于原始数据集中，stock_date列不出现在上面的数据集中。

这就是你想要的吗？

warehouse.stock %>% 
multidplyr::partition(., 
groups = c(warehouse, date_add), cluster = cluster) %>% 
summarize(n = sum(quantity), disp = sum(flag_stock)) %>% 
collect()

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51761902

复制

相似问题

问R:如何定义分区来使用2个或多个变量来划分组(multidplyr)
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R:如何定义分区来使用2个或多个变量来划分组(multidplyr)EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R:如何定义分区来使用2个或多个变量来划分组(multidplyr)
EN