我在数据帧上使用了填充(来自padr包)来填补时间间隔。现在,为了填补指定列集的空白值,我使用fill_by_function。通常,fill_by_function使用未引号的列名作为参数。然而,在我的例子中,我得到了一个列名列表。
我的问题是,如何能够在fill_by_function函数中传递列列表。请注意,列的列表不是预先定义的,所以我不能硬编码fill_by_function中的列名。
下面是我试过的一个例子,但是得到了一个错误。
x <- seq(as.Date('2016-01-01'), by = 'day', length.out = 366)
x <- x[sample(1:366, 200)] %>% sort
x.df <- data.frame(x = x,
y1 = runif(200, 10, 20) %>% round,
y2 = runif(200, 1, 50) %>% round,
y3 = runif(200, 20, 40) %>% round)
c.list <- c("y1","y2")
x.df %>% pad %>% fill_by_function(as.name(c.list),fun=mean)下面是我收到的错误消息
Error in inds[i] <- which(colnames_x == as.character(cols[[i]])) : replacement has length zero我还能用什么别的功能吗?
发布于 2017-06-18 20:28:42
这对我起了作用:
x.df %>% pad %>% fill_by_function(.cols=c.list,fun=mean) %>% tail(.)
x y1 y2 y3
361 2016-12-26 14.725 24.31 30.09
362 2016-12-27 14.000 28.00 21.00
363 2016-12-28 14.725 24.31 30.09
364 2016-12-29 15.000 47.00 22.00
365 2016-12-30 14.000 43.00 34.00
366 2016-12-31 17.000 14.00 21.00与之相比:
x.df %>% pad %>% fill_by_function(y1,fun=mean) %>% tail(.)
x y1 y2 y3
361 2016-12-26 14.725 NA NA
362 2016-12-27 14.000 28 21
363 2016-12-28 14.725 NA NA
364 2016-12-29 15.000 47 22
365 2016-12-30 14.000 43 34
366 2016-12-31 17.000 14 21检查输出是否确实是您想要的。
https://stackoverflow.com/questions/44619058
复制相似问题