首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >NVCC ptas=-v输出

NVCC ptas=-v输出
EN

Stack Overflow用户
提问于 2014-10-13 17:12:26
回答 1查看 453关注 0票数 2

A我用"nvcc -ccbin=icpc源代码/* -Iinclude -arch=sm_35 --ptxas--arch=sm_35=-v“编译了我的程序。产出如下:

代码语言:javascript
复制
ptxas info    : 0 bytes gmem
ptxas info    : 0 bytes gmem
ptxas info    : 450 bytes gmem
ptxas info    : Compiling entry function '_Z21process_full_instancePiPViS1_S_' for 'sm_35'
ptxas info    : Function properties for _Z21process_full_instancePiPViS1_S_
    408 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads
ptxas info    : Used 174 registers, 9748 bytes smem, 352 bytes cmem[0]

我认为gmem指的是全局内存,但是为什么第一行和第三行对geme有不同的值(0vs450)?

涂抹是共享内存,那么cmem呢?

块或SM (流处理器)的内存使用情况如何?块被动态地分配给SM。我们能推断出一个SM上将并发运行多少个块吗?

我的GPU是K20。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-10-13 19:01:35

涂抹是共享内存,那么cmem呢?

  • cmem表示常量内存。
  • gmem代表全局内存。
  • smem表示共享内存
  • lmem表示本地内存
  • 堆栈帧是本地内存的一部分。
  • 溢出加载存储使用堆栈框架的一部分

块或SM (流处理器)的内存使用情况如何?

不,寄存器的数量是每个线程,而共享内存是每个块。

我们能推断出一个SM上将并发运行多少个块吗?

不是的。由于无法确定每个块的线程数,所以无法计算每个块所需的资源。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26345319

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档