我想从我的GPU应用程序中提取数据,以检查其限制。我必须使用nvprof,因为应用程序运行在远程服务器上,因此我应该创建一个文件,以便在Visual 中本地导入。我尝试用nvprof -o file_name <app> <params>和nvprof --analysis-metrics --output-profile file_name <app> <params>创建文件,但是当我在Visual上导入这些文件时,在分析部分中,一些字段是空的:“全局内存加载数据不足”、“全局内存存储数据不足”、“内核SM数据不足”.。我如何生成一个文件(或更多),以获得分析部分的所有信息?我用nvcc用标志-lineinfo -arch compute_20 -code sm_20 --ptxas-options=-v编译cuda代码。以下是一些空字段的示例:

发布于 2017-05-03 02:57:53
您可以尝试添加会话,而不是将prof文件导入到可视探查器中。我遇到了类似的问题。我所做的是根据这里中的说明添加一个会话,您将能够看到所有的信息。
https://stackoverflow.com/questions/34934504
复制相似问题