我使用了一个以前版本的Nvidia profiler来分析l1和l2缓存命中率,但我不确定我使用的是哪个版本。似乎CUDA4.2可视化分析器没有L1和L2分析信息(除了全局缓存重放开销)。如何使用CUDA4.2(或特定的早期版本)可视化/命令行分析器分析L1或L2缓存命中率?
发布于 2013-03-19 16:12:51
不知道你使用的是windows还是linux,但是在windows上你有并行的Nsight for MS Visual Studio (还有一个eclipse版本)。Nsight可以让你定义许多不同的“实验”。甚至你也可以使用“自定义”实验。如果您选择"memory“实验,它将包含所需的L1和L2缓存命中率。我附上一张截图,显示

这是取自NSight Paralell3.0,但在以前的版本中也可用。
编辑:
使用Visual profiler (至少5.0版,但我猜以前的版本也类似),你可以设置你感兴趣的事件和指标,在visual Profiler 5.0中,你可以点击Run --> Configure Metrics and Events。在附加的窗口中,您可以设置您想要监视的任何计数器。可用的指标和事件将取决于底层硬件(即,GPU拥有的可访问计数器)。为我的GTX 480中的一些内存计数器附加图片

Linux EDITED 2:Linux Ok刚刚注意到,在编辑了原始问题之后,您正在询问……因此,对于linux,我不知道NVidia是否提供了这样的Visual Profiler (我猜他们提供了)。如果没有,您可能会对Eclipse NSight版本感兴趣……
https://stackoverflow.com/questions/15485346
复制相似问题