我正在尝试运行一些使用tensorflow-gpu的python代码。但是,当进程试图运行时,我将得到以下错误:
2018-04-13 20:03:49.215876: e tensorflow/stream_executor/cuda/cuda_dnn.cc:396]加载运行时CuDNN库: 7102 (兼容版本7100),但源代码是用7005编译的(兼容版本7000)。如果使用二进制安装,则升级CuDNN库以匹配。如果从源构建,请确保在运行时加载的库与编译配置期间指定的兼容版本匹配。 2018-04-13 20:03:49.220783: failed/core/kernels/conv_ops.cc:712]检查失败:F>parent()->GetConvolveAlgorithms( conv_parameters.ShouldIncludeWinogradNonfusedAlgo(),&algorithms)
但是,我输入了env,它列出了CUDNN_VERSION=7.0.5.15和LD_LIBRARY_PATH=/usr/local/cuda/extras/CUPTI/lib64:/usr/local/nvidia/lib:/usr/local/nvidia/lib64
我通过下载相关文件并将相关文件复制到/user/local/cuda/来安装cudn7.0.5
为什么会发生此错误?我正在使用kubernetes支持的集群。
发布于 2018-04-13 20:30:20
我使用来自askubuntu的这个修复了它
在这里粘贴该帖子的说明:
步骤0:从标准存储库安装cuda。(见如何在Ubuntu 16.04上安装CUDA?)
步骤1:注册nvidia开发人员帐户和下载cudnn在这里 (约80 MB)
第二步:检查您的cuda安装在哪里。对于存储库中的安装,它是/usr/lib/...和/usr/include。否则,它将是/usr/local/cuda/或/usr/local/cuda-<version>。您可以使用which nvcc或ldconfig -p | grep cuda检查它。
步骤3:复制文件:
$ cd folder/extracted/contents
$ sudo cp -P include/cudnn.h /usr/include
$ sudo cp -P lib64/libcudnn* /usr/lib/x86_64-linux-gnu/
$ sudo chmod a+r /usr/lib/x86_64-linux-gnu/libcudnn*基本上,在cudnn安装指令中,它只告诉您将cudnn.h和libcudnn*文件复制到cuda文件夹。但是,除此之外,还需要在系统主include和lib64文件夹中复制这些文件。这将解决这个问题。
https://stackoverflow.com/questions/49824454
复制相似问题