首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >PTX码性能

PTX码性能
EN

Stack Overflow用户
提问于 2016-03-29 20:43:49
回答 1查看 639关注 0票数 0

我知道数据自动化系统(不错),但我不知道PTX,所以我的问题是:

  • 学习ptx代码是否有助于提高gpu (CUDA)代码的性能?
  • 如果是,是否有一种方法可以编写ptx代码与CUDA代码相结合以提高性能?
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-03-29 21:02:19

根据我个人的经验,PTX有助于调试/检查一个重要的问题。不过,我只做过一次。另外,请记住,PTX只是编译器生成的直接代码,而不是上正在执行的实际汇编语言

如果您真的想看看机器代码,它是在PTX之后组装的,NVIDA提供了cuobjdump。我认为PTX有很多有用的信息和良好的文档,所以学习它会有帮助。然而,数据自动化系统的一般优化策略包括:

  • 最小化内存事务,特别是设备/主机之间的数据传输
  • 合并全局内存访问
  • 通过内核配置提高设备利用率
  • 避免翘曲发散

关于你的第二个问题,是的,你可以通过内联PTX用数据自动化系统写PTX。不过,我从来没有这样做过。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36294713

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档