我刚刚编写了一个函数,该函数使用一系列lapply调用来转换数据,如下所示:
somefun <- function(directory, id = 1:332) {
filenames <- sprintf("%03d.csv", id)
filenames <- paste(directory, filenames, sep="/")
ldf <- lapply(filenames, read.csv)
cdf <- lapply(ldf,complete.cases)
icdf <- lapply(cdf,as.numeric)
sicdf <- lapply(cdf,sum)
result <- cbind(id,sicdf)
result
}有没有更好的方法在R中编写这个lapplys序列?
发布于 2014-06-13 12:20:13
这并不总是最好的方法,但我最喜欢的简化一系列调用的方法就是使用magrittr包。
它实际上创建了一个管道,将参数从一个命令转发到另一个命令。对于像这样的长链或调用序列来说,它真的很神奇。句点可用于指定上一阶段的值的“管道化”位置。
尝试如下所示:
library(magrittr) # use install.packages("magrittr") if needed
sprintf("%03d.csv", id) %>%
paste(directory, filenames, sep="/") %>%
lapply(read.csv) %>%
lapply(complete.cases) %>%
lapply(as.numeric) %>%
lapply(sum) %>%
cbind(id, .)发布于 2014-06-13 10:14:33
您可以使用Reduce策略。下面是一些示例数据
xx<-matrix(runif(25), nrow=5)
xx[2,3]<-NA
write.table(xx, "num.txt")然后你就可以运行
trans<-list(
read.table,
function(x) x[complete.cases(x),],
colSums
)
Reduce(lapply, trans, list("num.txt"))请注意,您正在应用的某些函数可能不会以您希望的方式工作。例如,complete.cases根本不是真正的子集,你可以在我的转换列表中看到我是如何使用它的吗?as.numeric和sum也是如此。
https://stackoverflow.com/questions/24196618
复制相似问题