首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在AMD GCN卡上的OpenCL中,uint2的运行速度是否比ulong快?

在AMD GCN卡上的OpenCL中,uint2的运行速度是否比ulong快?
EN

Stack Overflow用户
提问于 2018-08-22 04:50:33
回答 1查看 185关注 0票数 0

哪个"+“运算快? 1) uint2 a,b,c;c=a+ b;2) ulong a,b,c;c=a+ b;

EN

回答 1

Stack Overflow用户

发布于 2018-10-05 21:24:05

AMD GCN没有本机64位整数向量支持,因此第二条语句将被转换为两个32位加法,一个V_ADD_U32后跟一个V_ADDC_U32,后者将第一个V_ADD_U32的进位标志考虑在内。

所以为了回答你的问题,它们在指令计数方面是相同的,但是第一个可以并行计算(指令级并行),并且如果你的内核是占用限制的(即.使用大量寄存器)。

如果您的语句可以由标量单元执行(即,它们不依赖于线程索引),然后游戏改变,第二个指令将只有一条指令(而不是两条),因为标量单元具有本机64位整数支持。

但是请记住,您的第一个语句与第二个语句不同,您将丢失进位标志。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51956528

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档