假设我有2个数据帧:
library(tidyverse)
quaters <- tibble(
quarter = c("Q1", "Q2","Q3", "Q4"),
start_date = as.Date(c("2020-4-20", "2020-7-21", "2020-10-22", "2021-1-22")),
end_date = as.Date(c("2020-7-20", "2020-10-21", "2021-1-22", "2021-4-22"))
)
test_data <- tibble(city =c("Paris", "London", "Rome"),
date = as.Date(c("2020-6-25", "2020-9-12", "2020-10-11")))我想根据"quarters“为"test_data”中的每个日期定义一个季度,并将其作为列添加到"test_data“中。因此,Paris应该是Q1,London - Q2,Rome Q3。我可以只用mutate或smth这样做吗?我可以用一个函数和sapply来做这件事,但是R计算大型数据集需要很多时间,我相信这不是最好的解决方案( quarter函数没有帮助,因为我想手动定义一个季度的开始和结束日期)。谢谢!
发布于 2020-12-20 01:24:16
我们可以使用来自data.table的非等联接
library(data.table)
setDT(test_data)[as.data.table(quaters),
quarter := i.quarter,on = .(date >= start_date, date <= end_date)]-output
test_data
# city date quarter
#1: Paris 2020-06-25 Q1
#2: London 2020-09-12 Q2
#3: Rome 2020-10-11 Q2https://stackoverflow.com/questions/65372516
复制相似问题