CUDA是否支持CUDA内核的JIT编译?
我知道OpenCL提供了这个功能。
我有一些变量在运行时不会改变(即只依赖于输入文件),因此我想在内核编译时(即运行时)使用宏来定义这些值。
如果我在编译时手动定义这些值,我的寄存器使用率将从53下降到46,这将极大地提高性能。
发布于 2012-11-27 01:29:29
如果使用Python是可行的,那么可以使用优秀的pycuda模块在运行时编译内核。与诸如Mako之类的模板引擎相结合,您将拥有一个非常强大的元编程环境,它将允许您针对任何体系结构和特定的设备属性对内核进行动态调优(显然,有些事情很难完全动态和自动化)。
您还可以考虑只维护几个具有不同参数的不同内核版本,您的程序可以在运行时根据您提供给它的任何输入在这些版本之间进行选择。
发布于 2015-03-12 19:01:11
它在cuda 7.0的nvrtc库中可用。通过这个库,你可以在运行时编译你的cuda代码。
http://devblogs.nvidia.com/parallelforall/cuda-7-release-candidate-feature-overview/
但是你能获得什么样的优势呢?在我看来,我找不到动态编译如此显著的优势。
https://stackoverflow.com/questions/13567123
复制相似问题