我正在尝试分析我的应用程序,它只使用cuBLAS与Nvidia Visual Profiler在Windows上,但它显示,在我的应用程序中根本没有使用图形处理器!也就是说,除了分析开销之外,时间线完全是空的。为了确保有人没有更改我的安全设置或其他东西,我分析了一个带有内核和cudaMemcpy调用的应用程序,并且它被正确地分析了。怎么回事?我是不是错过了一个场景?链接到错误版本的cuBLAS库?或者它实际上不是在调用GPU (尽管在我看来完全不可能…)?我使用英特尔的编译器来支持64位,如果这有什么不同的话。
谢谢!
发布于 2014-10-16 21:34:15
对于将来遇到这个问题的任何人:我不得不在我的cuBLAS函数中使用cudaProfilerStart()和cudaProfilerStop()。仅仅添加cudaDeviceSyncrhonize()并不能解决问题。
https://stackoverflow.com/questions/26392476
复制相似问题