首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用英特尔mkl的tensorflow性能下降

使用英特尔mkl的tensorflow性能下降
EN

Stack Overflow用户
提问于 2018-10-25 10:23:34
回答 1查看 547关注 0票数 1

使用预置深度学习镜像的普通tf1.11运行宽范围、线性和深度模型推理,用于gpu的M9版本显示出比版本M10 (用于cpu推理)更好的性能。

最新:tf- M9 -cu92

cpu:tf- M10 -cpu

在这两个镜像中,tf版本都是1.11,它们都预置了英特尔mkl优化的二进制文件。我打开了mkl指令的详细记录,在M10镜像上我看到了很多mkl相关的设置。

代码语言:javascript
复制
 KMP_AFFINITY=granularity=fine,verbose,compact,1,0
 KMP_BLOCKTIME=0
 KMP_SETTINGS=1
 OMP_NUM_THREADS=32

以及带有定时的mkl指令的记录。在M9镜像上,我没有观察到任何这样的东西,即使两个镜像都显示版本信息,如下所示:

代码语言:javascript
复制
MKL_VERBOSE Intel(R) MKL 2019.0 Product build 20180829 for Intel(R) 64 architecture Intel(R) Advanced Vector Extensions 2 (Intel(R) AVX2) enabled processors, Lnx 2.20GHz lp64 intel_thread
MKL_VERBOSE SDOT(2,0x5622b7736500,1,0x5622b7736500,1) 2.54ms CNR:OFF Dyn:1 FastMM:1 TID:0  NThr:16
1.11.0

当使用英特尔mkl指令而不是M9镜像时,我发现性能下降了2-4倍。注意:尽管M9镜像是针对图形处理器的,但我将cuda设备可见性和基准测试仅限于cpu推断。同样的观察也发生在另一个linux机器上,在一个干净的virtualenv中安装了tf 1.11的pip。

关于如何调试或最大限度地利用英特尔mkl库的任何见解。

EN

回答 1

Stack Overflow用户

发布于 2019-01-20 04:29:37

此行为已在M16+ (具有TF 1.12)中修复。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52980437

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档