文章/答案/技术大牛

发布

社区首页 >问答首页 >将时间序列切成特定的框，并对每个块进行标记

问将时间序列切成特定的框，并对每个块进行标记
EN

Stack Overflow用户

提问于 2021-03-01 20:06:31

回答 1查看 35关注 0票数 0

我在一个房间里有一些关于几天的CO2值的实验数据，这些数据都有时间和日期戳。我想把它分成一系列的“实验”，基于每个实验发生的时间的实验列表。

例如：

数据

df<-data.frame(CO2.ppm.=runif(10), Date.time.=as.POSIXct(" 2019-2-08 07:00:00") + runif(n=10, min=0, max=3600))

开始和停止时间的实验列表：

ExpertimentList<- data.frame(StartTime=c("2019-2-08 07:10:00", "2019-2-08 07:15:00", "2019-2-08 08:30:00"), StopTime=c("2019-2-08 07:12:00","2019-2-08 07:16:00","2019-2-08 08:15:00"),ExptID=c(1,2,3))

请注意，有时会测量到CO2，但未进行任何实验。例如，在07:12:00和07:15:00之间。

我想分开

由

和

到目前为止，我已经将所有内容转换为整数

df$Date.time.<-as.integer(df$Date.time.)
ExperimentList$StartTime<-as.integer(ExperimentList$StartTime
ExperimentList$StopTime<-as.integer(ExperimentList$StopTime)

然后看着

breakz<-dplyr::arrange(paste(Experiment_List$StartTime,Experiment_List$StopTime)%>%as_tibble())

cut(df$Dev.Date.Time,breaks=unique(breakz$value))

但是当没有实验发生的时候，我不能过滤掉数据。任何想法都是非常感谢的。

预期输出：

set.seed(143)
data.frame(CO2.ppm.=runif(10), Date.time.=sort(as.POSIXct(" 2019-2-08 07:00:00") + runif(n=10, min=0, max=3600)),ExptID=c(NA,NA,NA,1,NA,NA,NA,NA,NA,NA))

答案：

我发现@Ronak的答案会耗尽内存，所以我把data.frame分成了10000个行段：

df<-split(df, (as.numeric(rownames(df))-1) %/% 10000)

然后根据@Ronak的回答，我将代码弹出到一个函数中，并使用并行包中的mclapply。

#执行左连接以删除任何不属于实验的行

fuzzyJoinFunction<-function(a){
  a<-fuzzy_left_join(a, Experiment_List, 
                       by = c('Dev.Date.Time' = 'StartTime', 'Dev.Date.Time'= 'StopTime'), 
                       match_fun = c(`>=`, `<=`))
  a
}

df<-rbindlist(mclapply(X=df,FUN=fuzzyJoinFunction,mc.cores=4))

dplyr

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-03-01 20:48:46

我们可以使用

仅保留范围内的行。

library(dplyr)
library(fuzzyjoin)

#All the datetime values should be of type POSIXct.
ExpertimentList %>%
  mutate(across(c(StartTime, StopTime), lubridate::ymd_hms)) -> ExpertimentList


fuzzy_inner_join(df, ExpertimentList, 
                 by = c('Date.time.' = 'StartTime', 'Date.time.'= 'StopTime'), 
                 match_fun = c(`>=`, `<=`))

获取所有

最终输出中的值

对于

使用

..。

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66421855

复制

相似问题

问将时间序列切成特定的框，并对每个块进行标记
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将时间序列切成特定的框，并对每个块进行标记EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将时间序列切成特定的框，并对每个块进行标记
EN