我在许多论坛上读到NVIDIA视觉探查器串行化程序,以收集时间信息。
但是,在可视分析器的上下文选项卡中,提供了诸如“GPU上的内存副本和内核之间没有时间重叠”之类的建议,或者如果与内存和内核执行有重叠,则显示重叠时间。另外,如果您查看以下网页-幻灯片6,您可以看到重叠内核的输出跟踪。
我想知道分析器是否能够显示有关并发内核执行的信息(例如,如果我们使用3种不同的流并行运行3个内核,分析器可以显示这是否确实发生在GPU中)。如果是这样的话,在视觉分析器中我可以在哪里获得这些信息。
发布于 2012-08-07 16:17:59
是。
CUDA工具包5.0中的nvprof和Visual (nvvp)都支持并发内核执行。
https://stackoverflow.com/questions/11846086
复制相似问题