想象一下,我们正在做一些过程,我想在程序开始时设置一个总体种子:例如。
mylist <- list( as.list(rep(NA,3)), as.list(rep(NA,3)) )
foo <- function(x){ for(i in 1:length(x)){
x[[i]] <- sample(100,1)
}
return(x)
}
# start block
set.seed(1)
l1 <- lapply(mylist, foo)
l2 <- lapply(mylist, foo)
# end当然,在一个块中,l1和l2是不同的,但是如果我再次运行上面的块,l1将和以前一样,l2将和以前一样。
假设foo非常耗时,所以我想使用mclapply而不是lapply,所以我这样做了:
library(parallel)
# start block
set.seed(1)
mclapply(mylist , foo, mc.cores = 3)
mclapply(mylist , foo, mc.cores = 3)
# end如果我再次运行这个块,我下一次会得到不同的结果。如何产生与使用lapply但使用mclappy设置一个总体种子相同的行为。我查看过mclapply文档,但我不确定,因为我使用:
set.seed(1)
l1 <- mclapply(mylist , foo, mc.cores = 3, mc.set.seed=FALSE)
l2 <- mclapply(mylist , foo, mc.cores = 3, mc.set.seed=FALSE)结果l1和l2是一样的,这不是我想要的.
发布于 2015-05-26 21:21:20
parallel软件包提供了对“L‘厄瓜多尔-CMRG”随机数发生器的特殊支持,该随机数生成器是在parallel的同时推出的。您可以使用以下方法阅读该支持的文档:
library(parallel)
?mc.reset.stream要使用它,首先需要启用“L‘厄瓜多尔-CMRG”:
RNGkind("L'Ecuyer-CMRG")这样做后,代码(如:
set.seed(1)
mclapply(mylist, foo, mc.cores=3)
mclapply(mylist, foo, mc.cores=3)将是可重复的,但对mclapply的两个调用将返回相同的结果。这是因为调用mclapply不会改变主进程中随机数生成器的状态。
我使用了以下函数来跳过mclapply工作者使用的随机数流:
skip.streams <- function(n) {
x <- .Random.seed
for (i in seq_len(n))
x <- nextRNGStream(x)
assign('.Random.seed', x, pos=.GlobalEnv)
}您可以使用此函数获取我认为您想要的行为:
set.seed(1)
mclapply(mylist, foo, mc.cores=3)
skip.streams(3)
mclapply(mylist, foo, mc.cores=3)
skip.streams(3)https://stackoverflow.com/questions/30456481
复制相似问题