我正在学习CUDA,目前我有类似这样的东西。
__device__ void iterate_temperatures(int fieldSize, Atom *atoms) {
int temperature = threadIdx.x + blockDim.x * blockIdx.x;
nAtoms = pow(fieldSize, DIMENSION);
iterate_atoms<<< nAtoms >>>(atoms, nAtoms, temperature);
}问题是,每个温度都需要上一个温度的结果。
如何强制每个块等待最后一个块。
谢谢!
发布于 2010-12-03 20:39:36
只需调用__syncthreads()就可以实现您想要的效果。
https://stackoverflow.com/questions/4345566
复制相似问题