我在谷歌上搜索过,只在他们的技术简报链接的一个微不足道的例子中找到了Capability 3.0中新的动态并行性的从这里开始。我知道在明年这个时候之前,HPC专用卡可能就没有时间了 (在nat'l实验室拿到之后)。是的,我意识到他们给出的简单例子足以让你前进,但是越多,越好。
还有其他我错过的例子吗?
为了省去麻烦,以下是技术简报中给出的整个示例:
__global__ ChildKernel(void* data){
//Operate on data
}
__global__ ParentKernel(void *data){
ChildKernel<<<16, 1>>>(data);
}
// In Host Code
ParentKernel<<<256, 64>>(data);
// Recursion is also supported
__global__ RecursiveKernel(void* data){
if(continueRecursion == true)
RecursiveKernel<<<64, 16>>>(data);
}编辑: GTC talk CUDA编程模型的新特点主要关注的是CUDA 5中新的动态并行性。该链接有视频和幻灯片。仍然只是玩具例子,但比上面的技术简报要详细得多。
发布于 2012-11-02 04:05:50
这里是您需要的,动态并行编程指南。详细信息和示例:Guide.pdf
发布于 2012-12-02 12:11:02
仅仅是为了确认只支持GPU上的动态并行性,计算能力为3.5以上。
我安装了一个3.0GPU,安装了CODA5.0,我已经编译了动态并行示例nvcc -arch=sm_30 test.cu
并收到以下编译错误test.cu(10):error:只允许在compute_35体系结构或更高级别上从全局函数(“parent_launch”)调用全局函数(“child_launch”)。
GPU信息
设备0:"GeForce GT 640“CUDA驱动程序版本/运行时版本5.0 / 5.0 CUDA功能主要/次要版本号: 3.0
希望这能帮上忙
发布于 2012-06-03 23:36:10
我编辑了题为"...CUDA 5 .“的题目,因为动态并行在CUDA 5中是新出现的,而不是CUDA 4。我们还没有任何可用的公共示例,因为我们没有可以运行它们的公共硬件。Cuda5.0将支持动态并行性,但只支持Capability 3.5及更高版本(例如GK110)。这些文件将在今年晚些时候提供。
我们将发布一些例子与一个CUDA 5的候选版本更接近的时候,硬件可用。
https://stackoverflow.com/questions/10854325
复制相似问题