腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(734)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
使用CMAKE的cuda_compile_
ptx
编译成
ptx
kernel.
ptx
中: cmake_minimum_required(VERSION2.8)find_package(CUDA REQUIRED) test) 未生成
ptx
文件。如何使用cmake再现上述nvcc命令的行为?特别
浏览 6
修改于2017-05-23
得票数 4
回答已采纳
1
回答
PTX
码性能
我知道数据自动化系统(不错),但我不知道,所以我的问题是: 学习
ptx
代码是否有助于提高gpu (CUDA)代码的性能?如果是,是否有一种方法可以编写
ptx
代码与CUDA代码相结合以提高性能?
浏览 1
提问于2016-03-29
得票数 0
回答已采纳
1
回答
(默认变体)
PTX
指令‘
PTX
’什么时候有用?
PTX
有一个包含许多变体的。
浏览 4
修改于2020-02-17
得票数 1
1
回答
GPGPUsim
PTX
提取
当我阅读手册中的"
PTX
提取“部分时,我发现”在CUDA 4.0及以后的版本中,用于提取
ptx
和sass的胖古巴蛋白文件已不再可用。“,这让我感到困惑。
浏览 13
修改于2022-03-08
得票数 1
回答已采纳
1
回答
我怎么读
PTX
?
在VS中我需要什么样的配置来编译代码以提高可读性(将编译设置为
PTX
足够了吗?) 我需要什么工具来反向工程生成的
PTX
才能读取它?
浏览 3
修改于2013-06-01
得票数 3
回答已采纳
1
回答
PTX
-获取值/地址
我不明白在
PTX
中mov指令是如何工作的。如果a是寄存器或立即数,则将a移入d。顺便说一下,如果a是全局、局部或共享状态空间中的变量,则可以将a的地址移动到d中。
浏览 0
提问于2013-07-12
得票数 0
回答已采纳
5
回答
如何编译
PTX
代码
我需要修改
PTX
代码并直接编译它。原因是我希望有一些特定的指令在彼此之后,而且很难编写一个cuda代码,从而导致我的目标
PTX
代码,所以我需要直接修改
ptx
代码。
浏览 34
修改于2017-04-09
得票数 10
3
回答
PTX
-什么是CTA?
我正在学习
PTX
,我不明白CTA (计算线程数组)和CUDA块有什么不同。 它们是一回事吗?在我看来(我只是在
PTX
文档的开头),它们似乎是一样的
浏览 52
修改于2015-09-17
得票数 13
回答已采纳
1
回答
将内核链接到
PTX
函数
我可以使用包含在
PTX
文件中的
PTX
函数作为外部设备函数将其链接到另一个应该调用该函数的.cu文件吗? 这是来自的另一个问题,函数本身并不包含在.cu文件中,但我更愿意以某种方式链接
PTX
函数。
浏览 3
修改于2018-01-07
得票数 2
回答已采纳
1
回答
开始学习枚举,属性
PTx
我是C#的新手,现在我在学习枚举,我在属性
PTx
上遇到了这个问题。我该怎么办?Tx = Taxas.B; Tx = Taxas.C; public Taxas
PTx
浏览 0
提问于2012-04-19
得票数 0
回答已采纳
2
回答
库达-
PTX
携带传播
我想在CUDA
PTX
中添加两个32位无符号整数,我也想要处理进位传播。我正在使用下面的代码来完成这个任务,但是结果并不像预期的那样。
浏览 1
修改于2020-06-20
得票数 2
回答已采纳
1
回答
带有
PTX
输出的NVCC单独编译
为了了解CUDA正在生成什么样的代码,除了一个对象文件之外,我还喜欢编译到
ptx
。由于我的一些循环展开可能需要很长一段时间,所以我希望能够编译*.cu**→*`.
ptx
`**→*`.o`,而不是在*.cu**→*`.
ptx
`和*.cu**→*`.o`,上浪费时间。只需将-
ptx
添加到nvcc *.cu行即可获得所需的
ptx
输出。使用ptxas -c将*.
ptx
编译成*.o可以工作,但会导致可执行链接:Relocations in generic ELF (EM: 190)中的一个错误。使
浏览 19
提问于2014-01-21
得票数 2
回答已采纳
1
回答
PTX
内核名称损坏
当从
ptx
文件编译内核时,我无法链接我的Cuda程序。main.o kernel.o --gpu-architecture=sm_70 -o dlink.o如果我像下面这样编译(通过生成
ptx
),我会得到错误:nvcc -dc main.cu kernel.
ptx
--gpu-architecture
浏览 3
提问于2020-10-02
得票数 1
回答已采纳
1
回答
JCuda中的JIT,加载多个
ptx
模块
我在问题中说,我在JCuda中加载
ptx
模块时遇到了一些问题,在@talonmies的想法之后,我实现了他的解决方案的JCuda版本,以加载多个
ptx
文件并将它们作为一个模块加载。private CUfunction functionKernel; String ptxFileName4 = "file4.
ptx
"; String ptxFileName3 = "file3.
ptx
";
浏览 0
修改于2017-05-23
得票数 4
回答已采纳
1
回答
如何使用CUDA_FORCE_
PTX
_JIT?
根据NVIDIA编程指南: nvcc -o vectorAdd -gencode arch=compute_20,code=sm_20 vectorAdd.cu 当CUDA_FORC
浏览 4
提问于2013-01-27
得票数 0
回答已采纳
2
回答
如何获取要执行的
PTX
文件
我知道如何从.cu生成.
ptx
文件,以及如何从.
ptx
.生成.cubin文件,但我不知道如何获得最终的可执行文件。 更具体地说,我有一个编译成sample.
ptx
的sample.cu文件。然后,我使用nvcc将sample.
ptx
编译为sample.cubin。但是,如果没有主机代码,则无法直接执行此.cubin文件。如何将.cubin文件链接到原始.cu文件以生成最终的可执行文件?
浏览 71
修改于2021-05-30
得票数 2
回答已采纳
1
回答
在并行Nsight中调试内联
PTX
在并行Nsight中单步执行内联
PTX
时,是否可以查看
PTX
寄存器? 我可以在内联
PTX
上设置断点并遍历它,但是将鼠标悬停在
PTX
寄存器上不会显示它们的值。我可以打开SASS,悬停在这些寄存器上确实会显示它们的值,但很难跟踪
PTX
寄存器和SASS寄存器之间的关系。
浏览 1
修改于2012-09-10
得票数 1
回答已采纳
2
回答
CUDA:理解
PTX
信息
我没有找到多少有用的信息
PTX
信息--ptxas-options=-v,我发现了一个2008年NVCC有一个小的信息,但没有细节。4)在哪里可以找到解释*.
ptx
文件的文档?(我希望能够阅读/理解cuda的系统代码。)
浏览 0
提问于2012-09-07
得票数 9
1
回答
PTX
的指令调度有多重要?
据我所知,
PTX
的主要优点是给您提供了几个具体的访问指令。它也是中级编程语言。这意味着,nvidia编译器不会直接执行
PTX
代码。它将
PTX
代码重新编译成硬件专用组件.总之,当我们考虑这些术语时,我想知道
PTX
指令调度有什么影响吗?另外,如果我们重新调度
PTX
代码,我们能获得性能或者看到任何效果吗? 提前感谢
浏览 2
修改于2014-10-15
得票数 0
回答已采纳
2
回答
如何从CUDA C调用
ptx
函数?
我正在尝试找到一种从CUDA C调用
ptx
函数(.func)的方法。假设我有一个
ptx
函数,如下所示:{ ret;我知道我可以从
ptx
调用它,如下所示:但我不知道如何从CUDA C调用它,我知道我可以用asm()内联
ptx
程序集,但我还没有找到内联函数的方法
浏览 0
提问于2012-06-20
得票数 3
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券