A我用"nvcc -ccbin=icpc源代码/* -Iinclude -arch=sm_35 --ptxas--arch=sm_35=-v“编译了我的程序。产出如下:
ptxas info : 0 bytes gmem
ptxas info : 0 bytes gmem
ptxas info : 450 bytes gmem
ptxas info : Compiling entry function '_Z21process_full_instancePiPViS1_S_' for 'sm_35'
ptxas info : Function properties for _Z21process_full_instancePiPViS1_S_
408 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
ptxas info : Used 174 registers, 9748 bytes smem, 352 bytes cmem[0]我认为gmem指的是全局内存,但是为什么第一行和第三行对geme有不同的值(0vs450)?
涂抹是共享内存,那么cmem呢?
块或SM (流处理器)的内存使用情况如何?块被动态地分配给SM。我们能推断出一个SM上将并发运行多少个块吗?
我的GPU是K20。
发布于 2014-10-13 19:01:35
涂抹是共享内存,那么cmem呢?
块或SM (流处理器)的内存使用情况如何?
不,寄存器的数量是每个线程,而共享内存是每个块。
我们能推断出一个SM上将并发运行多少个块吗?
不是的。由于无法确定每个块的线程数,所以无法计算每个块所需的资源。
https://stackoverflow.com/questions/26345319
复制相似问题