在安装docker-ce之后,我尝试安装nvidia-docker。我遵循以下命令:https://github.com/NVIDIA/nvidia-docker安装nvidia-docker。它似乎已正确安装。
我试着跑:
$ sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi
docker: Error response from daemon: Unknown runtime specified nvidia.
See 'docker run --help'.不过,这是可行的(没有--runtime=nvidia):
$ docker container run -ti ubuntu bash关于我的系统的一些额外信息:它是一台带有8个GPU (Titan Xp)和nvidia驱动程序版本387.26的ubuntu服务器16.04。我可以在主机系统上运行nvidia-smi -l 1,它可以正常工作。
$ dpkg -l | grep -E '(nvidia|docker)'
ii docker-ce 18.06.1~ce~3-0~ubuntu amd64 Docker: the open-source application container engine
ii libnvidia-container-tools 1.0.0-1 amd64 NVIDIA container runtime library (command-line tools)
ii libnvidia-container1:amd64 1.0.0-1 amd64 NVIDIA container runtime library
ii nvidia-container-runtime 2.0.0+docker18.06.1-1 amd64 NVIDIA container runtime
ii nvidia-container-runtime-hook 1.4.0-1 amd64 NVIDIA container runtime hook
ii nvidia-docker2 2.0.3+docker18.06.1-1 all nvidia-docker CLI wrapper
$ cat /etc/docker/daemon.json
{
"runtimes": {
"nvidia": {
"path": "nvidia-container-runtime",
"runtimeArgs": []
}
}
}我遇到了:https://github.com/NVIDIA/nvidia-docker/issues/501,但我不确定我应该如何去做。
发布于 2019-02-07 18:29:03
看起来您可能需要清除docker并重新安装它,如文章:github issues所示
sudo apt remove docker-ce
sudo apt autoremove
sudo apt-get install docker-ce=5:18.09.0~3-0~ubuntu-bionic
sudo apt install nvidia-docker2发布于 2020-08-27 13:43:26
这就是我为CentOS 7解决上述问题的方法;希望它能帮助任何有类似问题的人。
为获取nvidia-container-runtime:,
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | sudo tee /etc/yum.repos.d/nvidia-container-runtime.reposudo yum-config-manager --disable libnvidia-container-experimental
sudo yum-config-manager --disable nvidia-container-runtime-experimental容器安装nvidia-
sudo yum install nvidia-container-runtimesudo vim /etc/docker/daemon.json使用nvidia-container- the的路径:
{
"runtimes": {
"nvidia": {
"path": "/usr/bin/nvidia-container-runtime",
"runtimeArgs": []
}
}
}最后,你需要
sudo pkill -SIGHUP dockerd发布于 2018-11-23 17:06:07
实际上,您可以尝试通过以下命令重新启动docker守护进程。
sudo systemctl daemon-reload
sudo systemctl restart docker或者,您可以尝试重新启动系统。要使nvidia-docker正常工作
https://stackoverflow.com/questions/52865988
复制相似问题