我正在我的ubuntu 18.04系统上安装库达-10.0。我已按照官方网站:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/的指示行事。
在运行cuda工具包提供的示例以验证安装时,我得到以下错误:
/usr/local/cuda-10.0/samples/bin/x86_64/linux/release/deviceQuery开始..。CUDA设备查询(Runtime )版本(CUDART静态链接) cudaGetDeviceCount返回35 -> CUDA驱动程序版本不足以满足CUDA运行时版本结果= FAIL
我运行了命令"nvidia-smi“,得到了下面的输出:
初始化NVML失败:未知错误
下面是命令"dmesg“的输出
4424407.320909 NVRM: API错配:客户端有440.82版本,而NVRM:这个内核模块有440.44版本。请确保此内核模块和所有NVIDIA驱动程序NVRM: components具有相同的版本。4426448.420756 NVRM: API错配:客户端有340.108版本,而NVRM:这个内核模块有440.44版本。请确保此内核模块和所有NVIDIA驱动程序NVRM: components具有相同的版本。
命令"cat /proc/driver/nvidia/version“的输出
NVRM版本: NVIDIA UNIX x86_64内核模块440.44 Sun 12月8日:38:38:56 UTC 2019 GCC版: gcc版本7.4.0 (Ubuntu7.4.0-1 ubuntu1~18.04.1)
我正在通过ssh和AnyDesk (通过GUI访问)在远程系统上安装它。有没有不需要我重新启动远程系统的解决方案。鉴于目前的电晕情况,如果我重新启动远程系统,我可能会遇到问题。
发布于 2021-01-28 01:27:15
这种情况发生在从Nvidia网站下载的.run文件中安装Nvidia驱动程序时。
Ubuntu有一个libnvidia-compute-4xx包,它提供了一些库版本(在您的例子中是440.82)。由nvidia-smi文件提供的.run需要一个稍微不同的版本(440.44)。解决方案是删除libnvidia-compute-4xx:# apt purge libnvidia-compute-4xx。
所有的Nvidia驱动程序安装指南都告诉您使用# apt remove nvidia*删除apt包,但是libnvidia-compute-4xx包转义了这个通配符,导致了这个库版本错配问题。
通过查看这个博客中的命令:https://blog.csdn.net/weixin_43825748/文章/详细资料/112979312,我找到了这个解决方案。
https://askubuntu.com/questions/1236164
复制相似问题