问Cuda 4 GPU间同步
EN

Stack Overflow用户

提问于 2011-04-04 22:46:58

回答 1查看 1K关注 0票数 1

有没有人在Cuda4上成功测试了这个特性？看起来我不能让它正常工作，不确定它是我代码中的一个bug，还是这个功能还没有完全实现。

例如，我想在将内存从一个gpu复制到另一个gpu之后进行内核调用。流0，在gpu0流1上创建mem0，在gpu1上创建mem1。两人都是费米·特斯拉(C2070)

cudaMemcpyAsync( mem1, mem0, size, cudaMemcpyDefault, stream0 );
cudaEventRecord(P2Pevent, stream0);

cudaStreamWaitEvent(stream1, P2Pevent, 0);
cudaKernel<<<block,thread,0,stream1>>>(mem1);

有时候，内存似乎还没有为内核做好准备，所以结果是不正确的。如果我在Gpu0上添加一个cudaDeviceSynchronize，那么它工作得很好。

谢谢

multi-gpu

cuda

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-04-05 16:06:29

这是我的代码中的一个bug！它确实工作正常，谢谢各位

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/5540187

复制

相似问题

问Cuda 4 GPU间同步
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Cuda 4 GPU间同步EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Cuda 4 GPU间同步
EN