我的数据集包含一个用于product类型和purchase数量的列。我希望能够从每行的实际purchase中减去每种product类型的平均purchase数量。
我有一个大致如下的数据集
library(dplyr)
set.seed(42)
product <- paste("prod - " , sample(c("A", "B", "C", "D"), size = 15,
replace = TRUE))
purch <- sample(5:10, size = 15, replace = TRUE)
fake_data <- tibble(product, purch)我可以使用split-apply-combine方法完成此操作,如下所示:
data_s <- split(fake_data, fake_data$product) #split
data_a <- lapply(data_s, function(m) cbind(m, m$purch - mean(m$purch))) #apply
data_c <- bind_rows(data_a) #combine这是可行的,但它恰好发生在使用%>%和dplyr的冗长且组织良好的链条中间。有没有一种方法可以用dplyr做到这一点,这样我就可以在不破坏链条的情况下获得我需要的东西?
谢谢。
发布于 2016-07-15 06:26:48
library(dplyr)
fake_data %>% group_by(product) %>%
mutate(NewVal = purch - mean(purch)) %>% arrange(product)https://stackoverflow.com/questions/38385015
复制相似问题