首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >nvidia-smi进程挂起,也不能用SIGKILL终止

nvidia-smi进程挂起,也不能用SIGKILL终止
EN

Stack Overflow用户
提问于 2017-01-05 15:46:17
回答 2查看 18.3K关注 0票数 23

我在Ubuntu14.04上,CUDA工具包8,驱动程序版本367.48

当我发出nvidia-smi命令时,它只是无限期地挂起。当我再次登录并试图杀死这个nvidia-smi进程时,例如使用kill -9 <PID>,它就不会被杀死。如果我给出另一个nvidia-smi命令,我就会发现这两个进程都在运行--当然是在从另一个shell进行日志记录时,因为这会像以前一样陷入困境。

会不会是与司机有关的问题?这不是最新的,但还是很新的。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-05-19 18:54:16

我通过在每次引导时执行来解决这个问题。

sudo nvidia-smi -pm 1

上面的命令启用持久性模式。这个问题已经影响了两年多的nvidia司机,但他们似乎对修复它并不感兴趣。这似乎与电源管理问题有关,在启动操作系统之后,如果nvidia-persistenced服务启用了no-persistence-mode选项,GPU将节省电源,nvidia-smi命令将挂起等待设备上的控制权。

票数 23
EN

Stack Overflow用户

发布于 2018-02-21 06:05:31

考虑到你的特殊情况,我会尝试重新安装它,就像bio建议的那样。

你试过做sudo kill -9 <PID>吗?你可能有,但还在外面。或者,也许通过sudo kill -15 <PID>来终止它。这似乎是你的司机卡在一个signal 1挂机,鉴于你告诉我们。

nvidia-smi在运行时会自动挂起,这似乎很奇怪,但问题的根源可能是安装不正确,或者超级用户访问时没有运行。

你试过使用:

service nvidia-smi status pgrep nvidia-smi ps -aux | grep nvidia-smi

才能得到它目前的状态?

不管怎么样,希望这能帮上忙。我会尝试卸载、重新安装或使用sudo apt --fix-broken来尝试修复损坏的包/驱动程序。

干杯!

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41489070

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档