我有问题,重构dplyr的方式,以保存非标准的评估。假设我希望创建一个总是选择和重命名的函数。
library(lazyeval)
library(dplyr)
df <- data.frame(a = c(1,2,3), f = c(4,5,6), lm = c(7, 8 , 9))
select_happy<- function(df, col){
col <- lazy(col)
fo <- interp(~x, x=col)
select_(df, happy=fo)
}
f <- function(){
print('foo')
}select_happy()是根据这个帖子Refactor R code when library functions use non-standard evaluation的答案写的。select_happy()工作在全局环境中未定义或定义的列名上。但是,当列名也是另一个命名空间中函数的名称时,它会遇到问题。
select_happy(df, a)
# happy
# 1 1
# 2 2
# 3 3
select_happy(df, f)
# happy
# 1 4
# 2 5
# 3 6
select_happy(df, lm)
# Error in eval(expr, envir, enclos) (from #4) : object 'datafile' not found
environment(f)
# <environment: R_GlobalEnv>
environment(lm)
# <environment: namespace:stats>对f和lm调用lazy()显示了延迟对象中的一个不同之处,其中lm的函数定义出现在延迟对象中,而f只是函数的名称。
lazy(f)
# <lazy>
# expr: f
# env: <environment: R_GlobalEnv>
lazy(lm)
# <lazy>
# expr: function (formula, data, subset, weights, na.action, method = "qr", ...
# env: <environment: R_GlobalEnv>substitute似乎与lm一起工作。
select_happy<- function(df, col){
col <- substitute(col) # <- substitute() instead of lazy()
fo <- interp(~x, x=col)
select_(df, happy=fo)
}
select_happy(df, lm)
# happy
# 1 7
# 2 8
# 3 9然而,在阅读了lazyeval之后,似乎lazy应该成为substitute的一个更好的替代品。此外,常规的select函数工作得很好。
select(df, happy=lm)
# happy
# 1 7
# 2 8
# 3 9我的问题是如何编写select_happy(),使其以select()所做的所有方式工作?我很难把我的头绕在范围和非标准的评估上。更广泛地说,用dplyr编程可以避免这些和其他问题的可靠策略是什么?
编辑
我测试了博士弟子的解决方案,它的效果很好,但我想知道是否有一种方法来使用参数,而不是点,为这个函数。我认为能够使用interp()也很重要,因为您可能希望将输入到一个更复杂的公式中,比如我之前链接到的文章。我认为问题的核心在于lazy_dots()捕获的表达式与lazy()不同。我想了解他们为什么行为不同,以及如何使用lazy()获得与lazy_dots()相同的功能。
g <- function(...){
lazy_dots(...)
}
h <- function(x){
lazy(x)
}
g(lm)[[1]]
# <lazy>
# expr: lm
# env: <environment: R_GlobalEnv>
h(lm)
# <lazy>
# expr: function (formula, data, subset, weights, na.action, method = "qr", ...
# env: <environment: R_GlobalEnv> 即使将.follow__symbols更改为FALSE for lazy(),使其与lazy_dots()相同,也不起作用。
lazy
# function (expr, env = parent.frame(), .follow_symbols = TRUE)
# {
# .Call(make_lazy, quote(expr), environment(), .follow_symbols)
# }
# <environment: namespace:lazyeval>
lazy_dots
# function (..., .follow_symbols = FALSE)
# {
# if (nargs() == 0)
# return(structure(list(), class = "lazy_dots"))
# .Call(make_lazy_dots, environment(), .follow_symbols)
# }
# <environment: namespace:lazyeval>
h2 <- function(x){
lazy(x, .follow_symbols=FALSE)
}
h2(lm)
# <lazy>
# expr: x
# env: <environment: 0xe4a42a8>我只是觉得自己被困在了该怎么办的地方。
发布于 2016-02-04 10:57:18
一种选择可能是使写select_happy的方式与标准的select函数几乎相同:
select_happy<- function(df, ...){
select_(df, .dots = setNames(lazy_dots(...), "happy"))
}
f <- function(){
print('foo')
}
> select_happy(df, a)
happy
1 1
2 2
3 3
>
> select_happy(df, f)
happy
1 4
2 5
3 6
>
> select_happy(df, lm)
happy
1 7
2 8
3 9请注意,标准select函数的函数定义是:
> select
function (.data, ...)
{
select_(.data, .dots = lazyeval::lazy_dots(...))
}
<environment: namespace:dplyr>还请注意,根据这个定义,select_happy接受要选择的多个列,但将任何其他列命名为"NA":
> select_happy(df, lm, a)
happy NA
1 7 1
2 8 2
3 9 3当然,您可以对这种情况进行一些修改,例如:
select_happy<- function(df, ...){
dots <- lazy_dots(...)
n <- length(dots)
if(n == 1) newnames <- "happy" else newnames <- paste0("happy", seq_len(n))
select_(df, .dots = setNames(dots, newnames))
}
> select_happy(df, f)
happy
1 4
2 5
3 6
> select_happy(df, lm, a)
happy1 happy2
1 7 1
2 8 2
3 9 3https://stackoverflow.com/questions/35195525
复制相似问题