我正在尝试使用cuda-gdb通过ssh在远程集群上调试我的代码。节点上有6个特斯拉C2070图形处理器:
$ deviceQuery | grep "^Device"
Device 0: "Tesla C2070"
Device 1: "Tesla C2070"
Device 2: "Tesla C2070"
Device 3: "Tesla C2070"
Device 4: "Tesla C2070"
Device 5: "Tesla C2070"但是当我在cuda-gdb下运行代码时,它仍然给出错误code=24:“致命的:所有CUDA设备都用于显示,不能在调试时使用。”
我已经设置了-gencode arch=compute_20,code=sm_20,并且编译得很好。当我在调试器中键入info cuda devices时,它输出No CUDA devices。我也尝试过导出CUDA_VISIBLE_DEVICES="0,2",但仍然不起作用。我该怎么办?我使用的是cuda 5.0。提前谢谢。
发布于 2013-04-02 01:22:18
尝试运行"lsof /dev/nvidia*",它将显示哪个程序使设备节点处于打开状态。如果X正在使用这些GPU,则可以从输出中看出这一点。
https://stackoverflow.com/questions/15444525
复制相似问题