首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >分析cublas应用程序

分析cublas应用程序
EN

Stack Overflow用户
提问于 2014-10-16 05:32:34
回答 1查看 323关注 0票数 4

我正在尝试分析我的应用程序,它只使用cuBLAS与Nvidia Visual Profiler在Windows上,但它显示,在我的应用程序中根本没有使用图形处理器!也就是说,除了分析开销之外,时间线完全是空的。为了确保有人没有更改我的安全设置或其他东西,我分析了一个带有内核和cudaMemcpy调用的应用程序,并且它被正确地分析了。怎么回事?我是不是错过了一个场景?链接到错误版本的cuBLAS库?或者它实际上不是在调用GPU (尽管在我看来完全不可能…)?我使用英特尔的编译器来支持64位,如果这有什么不同的话。

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2014-10-16 21:34:15

对于将来遇到这个问题的任何人:我不得不在我的cuBLAS函数中使用cudaProfilerStart()cudaProfilerStop()。仅仅添加cudaDeviceSyncrhonize()并不能解决问题。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26392476

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档