首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R:按群插值NAs

R:按群插值NAs
EN

Stack Overflow用户
提问于 2015-11-13 15:57:20
回答 2查看 6.7K关注 0票数 7

我想在数据帧的一个变量中进行线性插值,它考虑到: 1)两个点之间的时间差,2)获取数据的时刻,3)测量该变量的个体。

例如,在下一个dataframe中:

代码语言:javascript
复制
 df <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
            Individuals=c(1,1,1,1,1,1,1,2,2,2),
            Value=c(1, 2, 3, NA, 5, NA, 7, 5, NA, 7))
  df

我想获得:

代码语言:javascript
复制
 result <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
                Individuals=c(1,1,1,1,1,1,1,2,2,2),
                Value=c(1, 2, 3, 4, 5, 6, 7, 5, 5.5, 6))
 result

我不能完全使用包na.approx的函数zoo,因为所有的观察都不是连续的,有些观察属于一个单独的,而其他的则属于其他的。原因是,如果第二个人第一次使用NA而我只使用函数na.approx,我将使用来自individual==1的信息来插值individual==2NA (例如,下一个数据帧会有sucherror)。

代码语言:javascript
复制
  df_2 <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
                Individuals=c(1,1,1,1,1,1,1,2,2,2),
                Value=c(1, 2, 3, NA, 5, NA, 7, NA, 5, 7))
  df_2

我试过使用包zoodplyr

代码语言:javascript
复制
library(dplyr)
library(zoo)
proof <- df %>%
  group_by(Individuals) %>%
  na.approx(df$Value)

但是我不能在一个group_by对象中执行zoo

您知道如何按组在一个变量中插入NA值吗?

提前谢谢你,

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-11-13 16:07:53

使用data.frame而不是cbind来创建数据。cbind返回一个矩阵,但是您需要一个dplyr的数据框架。然后在na.approx内部使用mutate。我已经注释掉了group_by,因为您还没有在数据中提供分组变量,但是一旦将分组变量添加到数据框架中,这种方法就可以工作了。

代码语言:javascript
复制
df <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
            Individuals=c(1,1,1,1,1,1,1,2,2,2),
            Value=c(NA, 2, 3, NA, 5, NA, 7, 8, NA, 10))

library(dplyr)
library(zoo)

df %>%
  group_by(Individuals) %>%
  mutate(ValueInterp = na.approx(Value, na.rm=FALSE))    

time Individuals Value ValueInterp 1 1 1 NA NA 2 2 1 2 2 3 3 1 3 3 4 4 1 NA 4 5 5 1 5 5 6 6 1 NA 6 7 7 1 7 7 8 1 2 8 8 9 2 2 NA 9 10 3 2 10 10

更新:内插多列,我们可以使用mutate_at。下面是一个有两个值列的示例。我们使用mutate_at对列名中包含"Value"的所有列运行na.approxlist(interp=na.approx)告诉mutate_at通过运行na.approx并添加interp作为后缀来生成新的列名:

代码语言:javascript
复制
df <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
                 Individuals=c(1,1,1,1,1,1,1,2,2,2),
                 Value1=c(NA, 2, 3, NA, 5, NA, 7, 8, NA, 10),
                 Value2=c(NA, 2, 3, NA, 5, NA, 7, 8, NA, 10)*2)

df %>%
  group_by(Individuals) %>%
  mutate_at(vars(matches("Value")), list(interp=na.approx), na.rm=FALSE)

time Individuals Value1 Value2 Value1\_interp Value2\_interp <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 1 1 NA NA NA NA 2 2 1 2 4 2 4 3 3 1 3 6 3 6 4 4 1 NA NA 4 8 5 5 1 5 10 5 10 6 6 1 NA NA 6 12 7 7 1 7 14 7 14 8 1 2 8 16 8 16 9 2 2 NA NA 9 18 10 3 2 10 20 10 20

如果不希望保留原始的未内插列,则可以:

代码语言:javascript
复制
df %>%
  group_by(Individuals) %>%
  mutate_at(vars(matches("Value")), na.approx, na.rm=FALSE)
票数 10
EN

Stack Overflow用户

发布于 2015-11-13 16:21:55

我们可以使用data.table

代码语言:javascript
复制
library(data.table)
library(zoo)
setDT(df1)[, ValueInterp:= na.approx(Value, na.rm=TRUE), by = Individual]
票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33696795

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档