首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >处于未满变形中的活动线程数?

处于未满变形中的活动线程数?
EN

Stack Overflow用户
提问于 2014-02-25 02:25:32
回答 2查看 230关注 0票数 2

我在测试CUDA占用设备,我故意尝试了一个有一个线程的块。电子表格给了我

代码语言:javascript
复制
Active Threads per Multiprocessor:32
Active Warps per Multiprocessor:1

我理解为什么warps的数量是1,但预期每个SM的活动threads数量是1。这是否意味着,将生成一个偏差,其中31个结果将不会被取消提交。我怀疑这一点,但我想确认这一点。

干杯

EN

回答 2

Stack Overflow用户

发布于 2014-02-25 02:48:15

在今天的GPU中,调度的基本单位是warp,而不是线程。因此,无论您是只指定一个线程,还是指定所有32个线程,都会以同样的方式使用warp进行调度。

在这种情况下,我会说“活动线程”指的是与活动扭曲相关联的所有线程。这些线程中的一些可能什么都不做,这取决于你的块配置和/或实际的线程代码,但这些线程仍然涉及到调度的warps中。

是的,如果你只想运行一个线程,它需要一个完整的warp。

这就是为什么网格配置在任一位置都有1的原因之一:

代码语言:javascript
复制
my_kernel<<<N, 1>>>();

代码语言:javascript
复制
my_kernel<<<1,N>>>(); 

在使用GPU资源方面将是低效的。

票数 2
EN

Stack Overflow用户

发布于 2014-02-26 04:27:49

我创建了一个简单的测试程序,其中我声明了32字长的数组。内核代码很简单,d_atid=2*d_tid;I只在线程上启动内核。在显示结果时,我得到了d_a only scaled correctly...the access to my array的其他元素显示了一个错误。这告诉我确实调度了一个warp,但它只有一个活动线程,而不是32个线程,这就是我的问题和困惑

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21995907

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档