首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >变滞后/变铅矢量中元素差的计算

变滞后/变铅矢量中元素差的计算
EN

Stack Overflow用户
提问于 2020-06-12 11:08:18
回答 1查看 75关注 0票数 0

我有一些实验室数据,我正在计算移动时间框架/窗口上的样本测量值之间的差异,例如2分钟(对应于0-2,2-4,4-6分钟,静态窗口),问题是,尽管数据是每秒取样的,但也有一些丢失的样本(例如,1,2,4,6,7),所以我不能使用固定的滞后函数,特别是对于较大的时间窗口。

这是我尝试过的最有希望的。我试图计算行位置的差异,然后使用它来确定滞后值。

代码语言:javascript
复制
library(tidyverse)

df <- data.frame(sample_group = c(rep("a", 25), rep("b", 25)),t_seconds = c(1:50), measurement = seq(1,100,2))
df <- df[-c(5,10,23,33,44),] #remove samples

t_window = 5 

df_diff <- df %>%
  group_by(sample_group) %>%
  arrange(t_seconds) %>%
      mutate(lag_row = min(which(t_seconds >= t_seconds + t_window))- min(which(t_seconds == t_seconds)), #attempt to identify the lag value for each element 
             Meas_diff = measurement - lag(measurement, lag_row))

在这个例子(lag_row)中,我试图从向量和向量本身调用一个元素,这显然不起作用!为了更清楚地说明,我添加了“_v”来识别我想要的向量,_e作为向量min(which(t_seconds_v >= t_seconds_e + t_window))- min(which(t_seconds_v == t_seconds_e))的一个元素。

我试图避免使用循环,但我未能解决这个问题。如果有人有更好的主意我会很感激的?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-06-12 11:37:44

你的第一步应该是在你的时间序列中插入缺失的观测。然后,您可以使用最后一次观察-携带-向后操作来填充缺失的值。这为您提供了一个完整的常规时间序列。

您想要的输出非常不清楚,因此在下面的示例中,接下来的步骤只是猜测。根据需要调整。

代码语言:javascript
复制
#complete time series (using a data.table join):
library(data.table)
setDT(df)
df_fill <- df[, .SD[data.table(t_seconds = min(t_seconds):max(t_seconds)), 
                    on = "t_seconds"], 
              by = sample_group]
df_fill[, filled := is.na(measurement)]

#last observation carried backwards
library(zoo)
df_fill[, measurement := na.locf(measurement, fromLast = TRUE), by = sample_group]

#differences
df_fill[, diff_value := shift(measurement, -t_window) - measurement, by = sample_group]
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62343027

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档