首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >CUDA内核的即时编译(jit)可能吗?

CUDA内核的即时编译(jit)可能吗?
EN

Stack Overflow用户
提问于 2012-11-26 22:42:34
回答 2查看 3.2K关注 0票数 5

CUDA是否支持CUDA内核的JIT编译?

我知道OpenCL提供了这个功能。

我有一些变量在运行时不会改变(即只依赖于输入文件),因此我想在内核编译时(即运行时)使用宏来定义这些值。

如果我在编译时手动定义这些值,我的寄存器使用率将从53下降到46,这将极大地提高性能。

EN

回答 2

Stack Overflow用户

发布于 2012-11-27 01:29:29

如果使用Python是可行的,那么可以使用优秀的pycuda模块在运行时编译内核。与诸如Mako之类的模板引擎相结合,您将拥有一个非常强大的元编程环境,它将允许您针对任何体系结构和特定的设备属性对内核进行动态调优(显然,有些事情很难完全动态和自动化)。

您还可以考虑只维护几个具有不同参数的不同内核版本,您的程序可以在运行时根据您提供给它的任何输入在这些版本之间进行选择。

票数 1
EN

Stack Overflow用户

发布于 2015-03-12 19:01:11

它在cuda 7.0的nvrtc库中可用。通过这个库,你可以在运行时编译你的cuda代码。

http://devblogs.nvidia.com/parallelforall/cuda-7-release-candidate-feature-overview/

但是你能获得什么样的优势呢?在我看来,我找不到动态编译如此显著的优势。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13567123

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档