在并行Nsight中单步执行内联PTX时,是否可以查看PTX寄存器?
我可以在内联PTX上设置断点并遍历它,但是将鼠标悬停在PTX寄存器上不会显示它们的值。我可以打开SASS,悬停在这些寄存器上确实会显示它们的值,但很难跟踪PTX寄存器和SASS寄存器之间的关系。
发布于 2012-04-06 10:18:26
不幸的是,GPU不能直接执行PTX,它只能执行SASS微码。由于驱动程序(翻译PTX-> SASS )中的JIT编译器确实可以在编译期间自由地对PTX代码进行实质性更改,从而执行诸如公共子表达式消除之类的优化,因此您所观察到的1)“很难跟踪PTX寄存器和SASS寄存器之间的关系”和2)您不能在执行期间检查PTX寄存器的观点都太准确了。
我预计在可预见的未来,这些限制都不会被消除。
https://stackoverflow.com/questions/9986484
复制相似问题