我正在使用jsr166y ForkJoinPool在线程之间分发计算任务。但我肯定是做错了什么。
如果我创建的ForkJoinPool的并行度大于1(默认值是Runtime.availableProcessors();我一直在使用2-8个线程运行),我的任务似乎就能完美地工作。但是如果我用parallelism = 1创建ForkJoinPool,我会在不可预测的迭代次数后看到死锁。
是的-设置parallelism =1是一种奇怪的做法。在本例中,随着线程数量的增加,我正在分析一个并行算法,并且我希望将运行到单个线程的并行版本与基准串行实现进行比较,以便准确地确定并行实现的开销。
下面是一个简单的例子,说明了我所看到的问题。“task”是一个固定数组上的虚拟迭代,递归地划分为16个子任务。
如果在线程数=2(或更多)的情况下运行,它会可靠地运行到完成,但如果在线程数= 1的情况下运行,它总是会死锁。在不可预测的迭代次数之后,主循环在ForkJoinPool.invoke()中挂起,等待task.join(),工作线程退出。
我在Linux下运行JDK 1.6.0_21和1.6.0_22,并使用几天前从Doug Lea的网站(http://gee.cs.oswego.edu/dl/concurrency-interest/index.html)下载的jsr166y版本。
对我遗漏的地方有什么建议吗?在此之前,非常感谢您。
package concurrent;
import jsr166y.ForkJoinPool;
import jsr166y.RecursiveAction;
public class TestFjDeadlock {
private final static int[] intArray = new int[256 * 1024];
private final static float[] floatArray = new float[256 * 1024];
private final static int THREADS = 1;
private final static int TASKS = 16;
private final static int ITERATIONS = 10000;
public static void main(String[] args) {
// Initialize the array
for (int i = 0; i < intArray.length; i++) {
intArray[i] = i;
}
ForkJoinPool pool = new ForkJoinPool(THREADS);
// Run through ITERATIONS loops, subdividing the iteration into TASKS F-J subtasks
for (int i = 0; i < ITERATIONS; i++) {
pool.invoke(new RecursiveIterate(0, intArray.length));
}
pool.shutdown();
}
private static class RecursiveIterate extends RecursiveAction {
final int start;
final int end;
public RecursiveIterate(final int start, final int end) {
this.start = start;
this.end = end;
}
@Override
protected void compute() {
if ((end - start) <= (intArray.length / TASKS)) {
// We've reached the subdivision limit - iterate over the arrays
for (int i = start; i < end; i += 3) {
floatArray[i] += i + intArray[i];
}
} else {
// Subdivide and start new tasks
final int mid = (start + end) >>> 1;
invokeAll(new RecursiveIterate(start, mid), new RecursiveIterate(mid, end));
}
}
}
}发布于 2011-03-31 09:03:57
看起来像是ForkJoinPool里的一个bug。我在类的用法中看到的所有内容都符合您的示例。唯一的另一种可能性可能是你的某个任务抛出了异常并异常死亡(尽管这仍然应该得到处理)。
https://stackoverflow.com/questions/5493399
复制相似问题