首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Cuda 4 GPU间同步

Cuda 4 GPU间同步
EN

Stack Overflow用户
提问于 2011-04-04 22:46:58
回答 1查看 1K关注 0票数 1

有没有人在Cuda4上成功测试了这个特性?看起来我不能让它正常工作,不确定它是我代码中的一个bug,还是这个功能还没有完全实现。

例如,我想在将内存从一个gpu复制到另一个gpu之后进行内核调用。流0,在gpu0流1上创建mem0,在gpu1上创建mem1。两人都是费米·特斯拉(C2070)

代码语言:javascript
复制
cudaMemcpyAsync( mem1, mem0, size, cudaMemcpyDefault, stream0 );
cudaEventRecord(P2Pevent, stream0);

cudaStreamWaitEvent(stream1, P2Pevent, 0);
cudaKernel<<<block,thread,0,stream1>>>(mem1);

有时候,内存似乎还没有为内核做好准备,所以结果是不正确的。如果我在Gpu0上添加一个cudaDeviceSynchronize,那么它工作得很好。

谢谢

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-04-05 16:06:29

这是我的代码中的一个bug!它确实工作正常,谢谢各位

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5540187

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档