首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >合并相同的名称并获得支持数据的总和- Reprex

合并相同的名称并获得支持数据的总和- Reprex
EN

Stack Overflow用户
提问于 2021-11-06 14:38:40
回答 1查看 25关注 0票数 0

我有一个数据集,其中包含一个多次列出的客户名称。我希望逐月合并相同的客户名称,同时获得支持变量的总和。我喜欢使用dplyr,但我在计算支持变量(例如dep_delay和arr_delay )时遇到了问题。我使用了下面的reprex,其中承运商充当客户名称。感谢您抽出时间来看这个例子!

理想情况下,输出应如下所示:

承运商/月/ dep_delay / arr_delay

AA /1/ 3412 / 12234

UA /1/ 1517 / 2594

AA /1/ 12342 / 1231

UA /1/ 121 / 1234

#代码列表如下

代码语言:javascript
复制
library(tidyverse)
library(readr)
library(lubridate)
library(nycflights13)

flights_updated <- flights[,c(10,2,6,9)]
flights_updated <- group_by(flights_updated, carrier, month) %>% 
summarise (dep_delay = sum(dep_delay), arr_delay = sum(arr_delay)) 

我也尝试过这个作为替代方案:

我已经尝试了以下几行代码,但也没有用:

flights_updated <- flights_updated %>% group_by(carrier, month) %>% summarise_at(vars(dep_delay, arr_delay), sum)

aggregate(cbind(dep_delay, arr_delay) ~ carrier + month, data = flights_updated, sum, na.rm = TRUE)

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-11-08 15:06:10

在等待了一个周末的指导之后,我从@Talat找到了一个答案,它帮助我提供了所需的指导。How to sum a variable by group

代码语言:javascript
复制
#Load packages
library(tidyverse)
library(dplyr)
library(readr)
library(lubridate)
library(nycflights13)

flights_updated <- flights[,c(10,2,6,9)]

flights_updated <- flights_updated %>% 
  group_by(carrier, month) %>% 
  summarise(dep_delay = sum(dep_delay), arr_delay = sum(arr_delay))

flights_updated
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69864937

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档