首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >nvvp和nsight的分析器给出了不同的结果?

nvvp和nsight的分析器给出了不同的结果?
EN

Stack Overflow用户
提问于 2013-01-10 17:27:16
回答 1查看 600关注 0票数 0

我想试试gst_inst_128bit指令。在同一个程序中,nvvp给出了很多执行的gst_inst_128bit命令。而在nsight的分析器中,获得了4次gst_inst_32bit指令。它们应该是同一个程序。这种情况怎么会发生呢?

实验在Linux,CUDA 5.0,GTX 580上进行。程序只在内核函数中将数据从一个数组复制到另一个数组: main:

代码语言:javascript
复制
cudaMalloc((void**)&dev_a, NUM * sizeof(float));
cudaMalloc((void**)&dev_b, NUM * sizeof(float));
kernel<<<grid,block>>>((uint4 *)dev_a, (uint4 *)dev_b);

内核:

代码语言:javascript
复制
__global__ void kernel(uint4 *a, uint4 *b){
        unsigned int id = blockIdx.x * THREAD_NUM + threadIdx.x;
        for(unsigned int i = 0;i < LOOP/4;i++){
                b[id + i * GRID_NUM * THREAD_NUM] = a[id + i * GRID_NUM * THREAD_NUM];
        }
        return;
EN

回答 1

Stack Overflow用户

发布于 2013-01-12 01:21:48

Nsight EE中的Profiler和Linux上的独立Visual Profiler基于相同的代码库。请确保:

使用相同executable.

  • There的
  1. 在环境变量值上没有差异(例如LD_LIIBRARY_PATH).

请注意,Nsight EE启动UI可能会有一点混乱。当您在调试完调试版本后单击“配置文件”时,它实际上可能会在调试可执行文件上运行配置文件,试图保留所有自定义启动设置(例如,命令行参数、工作文件夹等)。你可以做好准备。从主菜单中单击Run->Profile Configurations...查看Nsight在分析应用程序时使用的设置。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/14254512

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档