首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >nvidia-docker :未知运行时指定的nvidia

nvidia-docker :未知运行时指定的nvidia
EN

Stack Overflow用户
提问于 2018-10-18 10:15:09
回答 6查看 23.7K关注 0票数 15

在安装docker-ce之后,我尝试安装nvidia-docker。我遵循以下命令:https://github.com/NVIDIA/nvidia-docker安装nvidia-docker。它似乎已正确安装。

我试着跑:

代码语言:javascript
复制
$ sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi
docker: Error response from daemon: Unknown runtime specified nvidia.
See 'docker run --help'.

不过,这是可行的(没有--runtime=nvidia):

代码语言:javascript
复制
$ docker container run -ti ubuntu bash

关于我的系统的一些额外信息:它是一台带有8个GPU (Titan Xp)和nvidia驱动程序版本387.26的ubuntu服务器16.04。我可以在主机系统上运行nvidia-smi -l 1,它可以正常工作。

代码语言:javascript
复制
$ dpkg -l | grep -E '(nvidia|docker)'
ii  docker-ce                              18.06.1~ce~3-0~ubuntu                        amd64        Docker: the open-source application container engine
ii  libnvidia-container-tools              1.0.0-1                                      amd64        NVIDIA container runtime library (command-line tools)
ii  libnvidia-container1:amd64             1.0.0-1                                      amd64        NVIDIA container runtime library
ii  nvidia-container-runtime               2.0.0+docker18.06.1-1                        amd64        NVIDIA container runtime
ii  nvidia-container-runtime-hook          1.4.0-1                                      amd64        NVIDIA container runtime hook
ii  nvidia-docker2                         2.0.3+docker18.06.1-1                        all          nvidia-docker CLI wrapper



$ cat /etc/docker/daemon.json 
{
    "runtimes": {
        "nvidia": {
            "path": "nvidia-container-runtime",
            "runtimeArgs": []
        }
    }
}

我遇到了:https://github.com/NVIDIA/nvidia-docker/issues/501,但我不确定我应该如何去做。

EN

回答 6

Stack Overflow用户

发布于 2019-02-07 18:29:03

看起来您可能需要清除docker并重新安装它,如文章:github issues所示

代码语言:javascript
复制
sudo apt remove docker-ce
sudo apt autoremove
sudo apt-get install docker-ce=5:18.09.0~3-0~ubuntu-bionic
sudo apt install nvidia-docker2
票数 2
EN

Stack Overflow用户

发布于 2020-08-27 13:43:26

这就是我为CentOS 7解决上述问题的方法;希望它能帮助任何有类似问题的人。

为获取nvidia-container-runtime:,

  • 添加必要的存储库

代码语言:javascript
复制
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | sudo tee /etc/yum.repos.d/nvidia-container-runtime.repo

  • (可选)在我的示例中,我禁用了实验存储库:

代码语言:javascript
复制
sudo yum-config-manager --disable libnvidia-container-experimental
sudo yum-config-manager --disable nvidia-container-runtime-experimental

容器安装nvidia-

  • -runtime包:

代码语言:javascript
复制
sudo yum install nvidia-container-runtime

  • 更新docker守护程序:

代码语言:javascript
复制
sudo vim /etc/docker/daemon.json

使用nvidia-container- the的路径:

代码语言:javascript
复制
{
    "runtimes": {
        "nvidia": {
            "path": "/usr/bin/nvidia-container-runtime",
            "runtimeArgs": []
        }
    }
}

最后,你需要

  • 更新路径:

代码语言:javascript
复制
sudo pkill -SIGHUP dockerd
票数 2
EN

Stack Overflow用户

发布于 2018-11-23 17:06:07

实际上,您可以尝试通过以下命令重新启动docker守护进程。

代码语言:javascript
复制
sudo systemctl daemon-reload
sudo systemctl restart docker

或者,您可以尝试重新启动系统。要使nvidia-docker正常工作

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52865988

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档