将参数范围探索和交叉验证合并到单个mclapply()命令中的“最佳”或“推荐”方式是什么?我担心的是,如果我将mclapply()包装在参数范围内,如果一些交叉验证在另一些交叉验证运行之前完成,一些内核可能会处于空闲状态。我的第一个想法是迭代跨产品的parameter_range X折叠,但这将需要一些混乱的CV折叠结果的组装。我将R 2.14与"parallel“一起使用。
发布于 2011-12-22 10:22:41
这要视情况而定--通常情况下,你会想要让内核过多,这样即使只有很少的进程处于饥饿状态,也不会影响性能。如果您的计算速度足够慢,您可以禁用预调度,这样空闲的内核将再次被馈送(不过,这会对进程管理造成相当大的影响)。如果两者都不起作用,你将不得不创建交叉产品,但装配并不是真的那么混乱(给定恒定数量的CV,实际上很容易)。
https://stackoverflow.com/questions/8589062
复制相似问题