我使用R (3.1)、plyr和doMC作为并行后端(据我所知,这是唯一可以与plyr一起工作的并行后端)
我的问题是如何从工作线程中写入全局变量。我有一个(非常人工的)例子:
library(doMC)
library(plyr)
registerDoMC(cores=2)
result1 = data.frame(id=c(1:3), a=NA)
result2 = data.frame(id=c(1:3), b=NA)
f = function(x){
result1[ result1$id==x$id, "a"] <<- x$a
result2[ result2$id==x$id, "b"] <<- x$b
}
data = data.frame(id=c(1:3), a=c(4:6), b=c(7:9))
a_ply(data, .margins=1, .fun=f, .parallel=T)因为我想填充两个数据帧,所以不能使用aaply或adply。该示例对parallel=FALSE做了它应该做的事情。当我并行执行时,结果data.frames保持为空。我知道我必须将全局变量导出到工作程序中,并且我尝试使用.paropts=list(.export=c("result1", "result2")),但这没有帮助……
有人知道如何将全局变量导出到doMC工作进程吗?或者,有没有另一种解决方案可以在一个并行环境中同时填充两个data.frames (没有plyr的mazbe?)
发布于 2014-09-09 18:26:57
不能从并行工作线程修改全局对象。这就是为什么你需要导出你的data.frames -工作人员不能访问全局环境,他们只更改导出的copy。
您需要重写函数以返回某种类型的值,稍后您可以使用该值来填充data.frame。
https://stackoverflow.com/questions/25741646
复制相似问题