首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >NVIDIA Nsight Visual Studio版4.1 RC1中的新问题暂停原因

NVIDIA Nsight Visual Studio版4.1 RC1中的新问题暂停原因
EN

Stack Overflow用户
提问于 2014-07-31 19:37:14
回答 1查看 1.7K关注 0票数 1

NVIDIA Nsight Visual版本4.1 RC1中,翘曲问题延迟原因被划分为9种类型,而不是4.0版本中的6种类型。从它的外观,“数据请求”被删除,“内存Throttle",”内存依赖“,”常量小姐“被添加。

但是,NVIDIA 4.1用户指南中的发出摊档原因组 (通过单击在问题的右上方设置白色问号的蓝色图标UI)没有从同一节中更新NVIDIA 4.0用户指南中的用户指南。

我想知道新问题拖延的原因是什么,以及减少这些问题的方法是什么。

4.1:

4.0:

EN

回答 1

Stack Overflow用户

发布于 2014-10-27 15:42:34

在Nsight 4.1中,取消了下列理由:

数据请求被删除。在Nsight <= 4.0中,当翘曲无法发出数据请求时,就会断言数据请求。

在Nsight 4.1中增加了以下理由:

内存节流阀-当内存节流阀由于内存数据路径中缺少资源而无法发出指令时,它会断言内存节流阀失速。如果这个原因很高,请尝试解决导致指令重放的内存合并问题(数据差异),或者尝试将内存访问聚合为向量访问。在CC5.x设备上,如果线程发出多个内存存储,然后退出,这一原因也可能发生在内核的末尾。

内存依赖项()--当下一条指令由于依赖内存或纹理依赖而无法发出时,翘曲会断言内存依赖关系停滞。如果这个原因很高,那么试着(a)改进内存合并,(b)提高内存级别的并行性,(c)将频繁访问的数据更接近SM (例如进入共享内存),(d)尝试计算数据而不是加载数据,或者(e)在SM3.5上尝试使用LDG。

常量丢失--如果翘曲试图访问常量,且常量不在缓存中,则翘曲会断言常量丢失失速。如果这一原因很高,请尝试将内核使用的常量分组到常量内存的同一区域(将声明移动到彼此之间),尝试将常量移动到全局内存,或尝试计算常量。

管道繁忙-如果翘曲下一条指令所需的数据路径繁忙且翘曲无法发出,则翘曲会断言管道繁忙。如果这个原因很高,请看管道利用率实验图,并尝试减少任何高利用率的管道。避免低吞吐量指令也可能有帮助。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25067518

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档