首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在英特尔处理器上,Tflite Quant推理比TFlite float32慢

在英特尔处理器上,Tflite Quant推理比TFlite float32慢
EN

Stack Overflow用户
提问于 2020-10-30 21:17:27
回答 1查看 304关注 0票数 0

我使用默认优化(Float32)设置将网络转换为TFlite,其推理速度约为25fps。当我转换为TFlite INT8量化时,它的推理速度在英特尔8核英特尔酷睿i9 2.3 GHz上约为2 fps。这在CPU上是预期的吗?有人能解释一下是什么导致INT8推理速度慢吗?

EN

回答 1

Stack Overflow用户

发布于 2020-11-02 20:23:21

你能提供该模型的更多细节吗?

可以肯定的是,量化模型比float32模型更小。

对于在移动CPU上部署,通常量化模型可能会更快。但是,英特尔台式机/笔记本电脑CPU可能无法保证这一点。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64609125

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档