我知道如何从.cu生成.ptx文件,以及如何从.ptx.生成.cubin文件,但我不知道如何获得最终的可执行文件。
更具体地说,我有一个编译成sample.ptx的sample.cu文件。然后,我使用nvcc将sample.ptx编译为sample.cubin。但是,如果没有主机代码,则无法直接执行此.cubin文件。如何将.cubin文件链接到原始.cu文件以生成最终的可执行文件?
发布于 2011-02-21 19:16:50
您应该能够使用cuModuleLoadDataEx直接从cuda driver api运行ptx代码。第5页有一个here示例
发布于 2012-03-31 10:03:42
从CUDA 4.0开始,您可以在CUDA内核中编写内联PTX。
https://stackoverflow.com/questions/4798278
复制相似问题