我有一台GTS 450,它有4个SM,每个SM上有48个内核。ie 192个CUDA核心
假设我使用的是有限的寄存器内存和共享内存。
使用计算能力2.1,要达到100%的占用率,最优的块大小和线程大小是多少?
发布于 2013-03-14 20:29:37
您需要适当的CUDA工具包(v5.0),并查找CUDA占用率计算器excel表,如果您还没有下载它。如果是这样,您可以使用我上面提到的文档。一旦您设置了初始属性/参数,它将告诉您如何实现100%或您想要的任何占用。其中之一就是计算机能力。这也是我想说的最重要的。
https://stackoverflow.com/questions/15408609
复制相似问题