我有脉搏血氧测定值的数据集。一种连续20分钟的措施。我想计算每一个6小时连续窗口的中值。窗口不会重叠,因此这不是滚动中值计算。有什么建议可以让R代码有效地做到这一点吗?整个数据集是多个病人和几天的数据;大约有100万行。
发布于 2022-01-05 03:44:18
来自蒂迪弗斯的流光溢彩的图书馆非常有帮助。您可以使用floor_date函数找到6小时的周期。
library(dplyr)
library(lubridate)
df<-tibble::tribble(
~date_time, ~pulse_ox,
"1/1/21 11:21.21", 97,
"1/2/21 11:34.34", 89
)
df_new<-df %>%
mutate(date_time_6_hour=floor_date(dmy_hms(date_time),"6 hours")) %>%
group_by(date_time_6_hour) %>%
summarize(median=median(pulse_ox))https://stackoverflow.com/questions/70587495
复制相似问题