我想在给定日期周围创建一个时间窗口。其他的问题集中在有一个开始和结束日期,我唯一的事情是一个日期,我想创造一个窗口周围。目前,我有一个有多个日期和一个ID的df,我想在日期从-2到+2的范围内创建时间窗口。结果应该以df格式存储,这样我就可以将值从另一个df连接到它。实际的数据集要大得多,因此手动输入所有ID的开始日期和结束日期并不是一个真正的选项。
df1 =
ID Date
56 2016-05-22
894 2016-11-09最后得到一个如下所示的df
ID date
56 2016-05-20
56 2016-05-21
56 2016-05-22
56 2016-05-23
56 2016-05-24
894 2016-11-07
894 2016-11-08
894 2016-11-09
894 2016-11-10
894 2016-11-11 发布于 2019-03-01 10:33:17
我们可以使用complete从tidyr,这使得它很容易完成的序列,即
library(tidyverse)
df %>%
mutate(Date = as.Date(Date)) %>%
group_by(ID) %>%
complete(Date = seq.Date((Date-2), (Date+2), by = 'days'))这给了,
A tibble: 10 x 2#组: ID 2 ID日期1 56 2016-05-20 2 56 2016-21 3 2016-05-22 4 56 2016-05-23 5 56 2016-05-24 6 894 2016-11-07 7 894 2016-11-08 8 894 2016-11-09 9 894 2016-11-10 894 2016-11 10 894 2016-11-11 894 2016-11-10 894 2016-11-10 894 2016-11-10 894 2016-11-10 894 2016-11-10 894 2016-11
发布于 2019-03-01 10:33:59
下面是一个快速的data.table解决方案
library(data.table)
setDT(df1)[, .(date = seq(as.Date(Date) - 2, as.Date(Date) + 2, 1)), by = ID]
# ID date
# 1: 56 2016-05-20
# 2: 56 2016-05-21
# 3: 56 2016-05-22
# 4: 56 2016-05-23
# 5: 56 2016-05-24
# 6: 894 2016-11-07
# 7: 894 2016-11-08
# 8: 894 2016-11-09
# 9: 894 2016-11-10
#10: 894 2016-11-11样本数据
df1 <- read.table(text = " ID Date
56 2016-05-22
894 2016-11-09", header = T)发布于 2019-03-01 11:58:31
base R选项是循环遍历“Date”列,获取list中的序列,然后根据“list”的lengths授权“ID”,以创建新的“data.frame”,同时连接list元素
lst1 <- lapply(df1$Date, function(x) seq(x-2, x+2, by = '1 day'))
data.frame(ID = rep(df1$ID, lengths(lst1)), date = do.call(c, lst1))
# ID date
#1 56 2016-05-20
#2 56 2016-05-21
#3 56 2016-05-22
#4 56 2016-05-23
#5 56 2016-05-24
#6 894 2016-11-07
#7 894 2016-11-08
#8 894 2016-11-09
#9 894 2016-11-10
#10 894 2016-11-11数据
df1 <- structure(list(ID = c(56L, 894L), Date = structure(c(16943, 17114
), class = "Date")), row.names = c(NA, -2L), class = "data.frame")https://stackoverflow.com/questions/54942610
复制相似问题