首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >CUDA Warp执行效率

CUDA Warp执行效率
EN

Stack Overflow用户
提问于 2016-08-03 08:38:15
回答 1查看 324关注 0票数 0

我可以获得每个内核的warp_execution_efficiency,但是如何获得我的程序的总warp_execution_efficiency?

EN

回答 1

Stack Overflow用户

发布于 2016-08-03 09:12:03

注意:计算所有内核中的单个数字对于优化目的不太可能有用。

NVIDIA的分析器是以内核为中心的,所以直接查询信息是不可能的。但是,您可以运行nvprof --csv --metrics warp_execution_efficiency,然后将输出放入Excel、R或您最喜欢的统计软件中,并在那里处理它。

这样做的一个问题是,warp_execution_efficiency涉及平均值,因此您不能只取平均值。您也许能够获得Visual Profiler所不提供的一些方便的可视化效果。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38732584

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档