我正在使用nvprof运行我的程序,以使用以下命令获取配置文件信息:
nvprof -o profileOutput -s ./exe args我想要关于曲速散度,合并读/写,占用等的信息。但是当我打开文件profileOutput时,它完全是另一种格式,有奇怪的符号,比如@^@^.....
我要在vim中打开文件。查看CUDA程序的配置文件信息的正确方式是什么。请帮帮忙。
发布于 2014-08-01 04:05:29
您不需要-s,因为它本身就是默认情况。
-o指定可在以后导入或由Nvidia visual profiler打开的输出文件,这是不可读的。
如果你需要计算入住率,你可以使用Nvidia提供的这个occupancy calculator。有一个关于它的article。
如果需要跟踪分支,可以在跟踪模式下使用性能分析,并跟踪分支。
发布于 2015-03-04 17:53:41
您可以在Nvidia Visual Profiler (通常包含在CUDA SDK中)中打开输出文件。
还有一种生成人类可读文件的可能性:您可以为nvprof指定--log-file human-readable-output.log选项(当然,human-readable-output.log是您的输出文件名)。
用于收集事件的GPU trace;
--events的--print-gpu-trace (例如,分支、启动的warps etc.);--metrics的数量)用于某些自定义指标(如共享负载事务、dram利用率等-可以通过在命令行中键入nvprof --query-metrics查看的指标的完整列表)。您可以在NVIDIA nvprof documentation中找到的完整选项列表。
https://stackoverflow.com/questions/13581129
复制相似问题