首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Tensorflow AVX支持

Tensorflow AVX支持
EN

Stack Overflow用户
提问于 2016-07-21 02:21:19
回答 2查看 4.1K关注 0票数 6

有人知道Tensorflow编译的可执行文件这里是否包括AVX支持吗?我在Google引擎上运行了Tensorflow的编译版本,而且速度很慢。狗慢点。冷糖蜜慢。洛杉矶交通缓慢。这篇文章说,支持AVX的编译显着地提高了Google的性能,但是当我在那个站点上遵循编译过程时,它就失败了。只是想知道AVX是否已经在可执行文件中了?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-11-11 15:46:02

不,tensorflow默认发行版是构建没有CPU扩展的,如SSE4.1、SSE4.2、AVX、AVX2、FMA等,因为这些构建(例如来自pip install tensorflow的构建)旨在与尽可能多的CPU兼容。另一个论点是,即使有了这些扩展,CPU也比GPU慢得多,而且预计在GPU上执行中型和大型机器学习培训。也见一个相关讨论

文章是正确的,AVX和FMA指令显著(高达300%!)加速线性代数的计算,即点积、矩阵乘、卷积等。如果你想利用它,我必须通过从源编译tensorflow,这是在这个问题中讨论的。

票数 5
EN

Stack Overflow用户

发布于 2017-11-15 12:50:33

这是最简单的方法。只有一步。

这很容易,对速度有很大的影响。可以使训练速度提高3倍。

参考tensorflow的自定义构建

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38493835

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档