我正在尝试获取cuFFT库调用的分析数据,例如plan和exec。我使用的是nvprof (命令行分析工具),选项为"--print-api-trace“。它打印除cuFFT apis之外的所有apis的时间。是否有任何标志需要更改才能获得cuFFT分析数据?或者我需要使用这些事件来衡量自己?
发布于 2013-04-15 13:02:54
根据nvprof documentation,api-trace-mode
CUDA trace模式显示所有
运行时和驱动程序API调用的时间线
cuFFT既不是CUDA runtime API也不是CUDA driver API。它是一个用于快速傅立叶变换的例程库,其文档为here。
当然,您仍然可以使用nvprof、命令行分析器或可视分析器来收集有关cuFFT如何使用GPU的数据。
发布于 2013-04-15 12:57:50
让它工作起来..我没有使用nvprof,而是使用了CUDA_PROFILE环境变量。
https://stackoverflow.com/questions/16007281
复制相似问题