首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在CUDA中读取nvprof的输出

在CUDA中读取nvprof的输出
EN

Stack Overflow用户
提问于 2012-11-27 17:31:44
回答 2查看 16.1K关注 0票数 5

我正在使用nvprof运行我的程序,以使用以下命令获取配置文件信息:

代码语言:javascript
复制
nvprof -o profileOutput -s ./exe args

我想要关于曲速散度,合并读/写,占用等的信息。但是当我打开文件profileOutput时,它完全是另一种格式,有奇怪的符号,比如@^@^.....

我要在vim中打开文件。查看CUDA程序的配置文件信息的正确方式是什么。请帮帮忙。

EN

回答 2

Stack Overflow用户

发布于 2014-08-01 04:05:29

您不需要-s,因为它本身就是默认情况。

-o指定可在以后导入或由Nvidia visual profiler打开的输出文件,这是不可读的。

如果你需要计算入住率,你可以使用Nvidia提供的这个occupancy calculator。有一个关于它的article

如果需要跟踪分支,可以在跟踪模式下使用性能分析,并跟踪分支。

票数 5
EN

Stack Overflow用户

发布于 2015-03-04 17:53:41

您可以在Nvidia Visual Profiler (通常包含在CUDA SDK中)中打开输出文件。

还有一种生成人类可读文件的可能性:您可以为nvprof指定--log-file human-readable-output.log选项(当然,human-readable-output.log是您的输出文件名)。

用于收集事件的GPU trace;

  • --events
  • --print-gpu-trace (例如,分支、启动的warps etc.);
  • --metrics的数量)用于某些自定义指标(如共享负载事务、dram利用率等-可以通过在命令行中键入nvprof --query-metrics查看的指标的完整列表)。

您可以在NVIDIA nvprof documentation中找到的完整选项列表。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13581129

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档