首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >库达螺纹线性分度

库达螺纹线性分度
EN

Stack Overflow用户
提问于 2014-11-04 13:04:00
回答 1查看 213关注 0票数 0

我需要对我的线程进行线性索引,以确保前32个线程属于相同的翘曲,也就是说,线性索引遵循内部创建翘曲的方式。换句话说,是用于创建warps c或fortran的线性索引。要解释这一点,请考虑一个大小为2x5的线程块。我可以创建一个遵循fortran或c约定的线性索引:

代码语言:javascript
复制
0, 1, 2, 3, 4
5, 6, 7, 8, 9

代码语言:javascript
复制
0, 2, 4, 6, 8
1, 3, 5, 7, 9

对于一个大型数组,我希望确保我的前32个线程都处于相同的翘曲之中。如何正确地生成线性索引?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-11-04 13:26:06

您的线程被排定为32组。线程0到31在第一个经纱,32-63在第二个等等。如果是threads%32 != 0,最后一个偏差是“阴影”线程(因此您必须创建一种机制来防止这些线程访问错误的内存位置,通常是if语句)。

您无法更改此顺序,因此前32个线程始终处于相同的翘曲状态。尽管处于第一个翘曲,但这并不保证这个翘曲首先会被执行,SM会在方便的时候安排翘曲。

来自this的答案:

线程按x,y,z顺序分组。因此,16x16线程块将在前32线程翘曲中按以下顺序排列线程:

warp:线程ID (x,y,z)

代码语言:javascript
复制
0: 0,0,0
1: 1,0,0
2: 2,0,0
3: 3,0,0
...
15: 15,0,0
16: 0,1,0
17: 1,1,0
18: 2,1,0
19: 3,1,0
...
31: 15,1,0
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26735860

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档