我有深FC模型(7层,每层500个单位),我需要加快它的生产。内存需求并不重要。除了量化之外,您还能建议哪些工具或方法。有几个关于这方面的工作,几次加速,但我找不到任何工具的Tensorflow。我找到了CNN压缩/加速的唯一工具。
发布于 2017-08-31 16:11:30
提高软件速度取决于减少瓶颈。您是否对代码进行了基准测试,以找出哪些操作花费的时间最长?
在TensorFlow代码中,可能是GPU或CPU。TensorFlow教程有一个"性能指南“,其中列出了最佳实践。它们包括:
·从源·利用队列构建和安装data·在CPU上进行预处理。使用NCHW图像数据format·在GPU上放置共享参数。使用融合批处理规范
https://datascience.stackexchange.com/questions/22737
相似问题