关于这个问题,我已经在nvidia-码头回购中经历了三个不同的问题,但实际上我不知道到底出了什么问题。
我是一个笨重的码头用户,但我不太了解在这些问题上使用的术语和解决方案。
当我以sudo的形式运行nvidia-smi时,一切都很好,我得到了标准输出。我的nvidia-docker-plugin已经启动并运行,当我运行nvidia-docker run --rm nvidia/cuda nvidia-smi时会收到这些消息。
nvidia-docker-plugin / 2017/11/04 09:14:18接收到了卷“nvidia_driver_387.22”块的挂载请求nvidia-docker-plugin2017/11/04:14:18收到了卷“nvidia_driver_387.22”的卸载请求
我还尝试运行deepo存储库,无法让它工作,因为我的所有容器在启动时退出,nvidia-docker run --rm nvidia/cuda nvidia-smi输出错误:
container_linux.go:247:启动容器进程导致"exec:\“nvidia-smi\:可执行文件在$PATH中找不到”/usr/bin/docker-当前:来自守护进程的错误响应: oci运行时错误: container_linux.go:247:启动容器进程导致"exec:\"nvidia-smi\":可执行文件在$PATH中找不到。
我做错了什么?
我运行Fedora 26,如果有什么不同的话
发布于 2017-11-09 13:46:35
我刚刚解决了这个问题。
删除与nvidia-docker-plugin相关的卷解决了这个问题。
对于将来的读者,只需读取nvidia-docker-plugin上的日志消息,查找挂载/卸载日志行,然后使用以下命令删除卷
docker volume rm -f <volume_to_remove>,volume_to_remove应该类似于nvidia_driver_387.22 (与我的情况相匹配)
问题似乎是,到nvidia-smi调用的映射是在卷创建时进行的,并且删除和重新附加卷修复了以下问题
发布于 2017-11-09 03:58:14
在Ubuntu上,您应该安装nvidia-modprobe包。我知道这也存在于费多拉。由于某些原因,这种依赖也不需要文档化。
https://stackoverflow.com/questions/47109109
复制相似问题