首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在CUDA分析器nvvp中,“共享/全局内存重放开销”意味着什么?它是如何计算的?

在CUDA分析器nvvp中,“共享/全局内存重放开销”意味着什么?它是如何计算的?
EN

Stack Overflow用户
提问于 2012-11-25 14:27:58
回答 1查看 2.4K关注 0票数 6

当我们使用CUDA分析器nvvp时,有几个与指令相关的“开销”,例如:

  • 支路发散开销;
  • 共享/全局内存重放开销;以及
  • 本地/全局缓存重放开销。

我的问题是:

  1. 造成这些间接费用的原因是什么?
  2. 它们是如何计算的?
  3. 同样,如何计算全局负载/存储效率?

附件:我在CUDA5工具包中的“CUDA Profiler用户指南”中找到了计算这些开销的所有公式。

EN

回答 1

Stack Overflow用户

发布于 2012-12-10 18:18:34

你可以在这里找到你的问题的一些答案:

Why does CUDA Profiler indicate replayed instructions: 82% != global replay + local replay + shared replay?

重放指令(%) --这将给出内核执行期间重放指令的百分比。重放指令是由硬件实际发出的指令数与要由内核执行的指令数之间的区别。理想情况下,这应该是零。计算为100 *(发出的指令-执行的指令)/发出的指令 全局内存重放(%)由于全局内存访问而导致的重放指令的百分比。此值计算为100 * (l1全局负载丢失)/发出的指令 本地内存重放(%)由于本地内存访问而导致的重放指令的百分比。此值计算为100 * (l1本地加载丢失+ l1本地存储丢失)/发出的指令 共享银行冲突重播(%)由于共享内存库冲突而导致的重放指令的百分比。此值计算为100 * (l1共享冲突)/发出的指令

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13551923

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档