我在Ubuntu14.04上,CUDA工具包8,驱动程序版本367.48。
当我发出nvidia-smi命令时,它只是无限期地挂起。当我再次登录并试图杀死这个nvidia-smi进程时,例如使用kill -9 <PID>,它就不会被杀死。如果我给出另一个nvidia-smi命令,我就会发现这两个进程都在运行--当然是在从另一个shell进行日志记录时,因为这会像以前一样陷入困境。
会不会是与司机有关的问题?这不是最新的,但还是很新的。
发布于 2018-05-19 18:54:16
我通过在每次引导时执行来解决这个问题。
sudo nvidia-smi -pm 1
上面的命令启用持久性模式。这个问题已经影响了两年多的nvidia司机,但他们似乎对修复它并不感兴趣。这似乎与电源管理问题有关,在启动操作系统之后,如果nvidia-persistenced服务启用了no-persistence-mode选项,GPU将节省电源,nvidia-smi命令将挂起等待设备上的控制权。
发布于 2018-02-21 06:05:31
考虑到你的特殊情况,我会尝试重新安装它,就像bio建议的那样。
你试过做sudo kill -9 <PID>吗?你可能有,但还在外面。或者,也许通过sudo kill -15 <PID>来终止它。这似乎是你的司机卡在一个signal 1挂机,鉴于你告诉我们。
nvidia-smi在运行时会自动挂起,这似乎很奇怪,但问题的根源可能是安装不正确,或者超级用户访问时没有运行。
你试过使用:
service nvidia-smi status pgrep nvidia-smi ps -aux | grep nvidia-smi
才能得到它目前的状态?
不管怎么样,希望这能帮上忙。我会尝试卸载、重新安装或使用sudo apt --fix-broken来尝试修复损坏的包/驱动程序。
干杯!
https://stackoverflow.com/questions/41489070
复制相似问题