文章/答案/技术大牛

发布

社区首页 >问答首页 >动态范围量化

问动态范围量化
EN

Stack Overflow用户

提问于 2021-07-25 20:01:07

回答 1查看 264关注 0票数 0

用于动态范围量化的tensorflow文档指出：

推理时，权值由8位精度转换为浮点，并使用浮点核进行计算.此转换只进行一次并缓存以减少延迟。

此外，在动态范围量化中，激活总是存储在浮点数32中，但是在处理过程中它们被转换为8位整数，在处理完成后返回到浮点。

我感到困惑的是，如果在推理时将权重转换为float32，那么量化是如何完成的呢？

tensorflow

tensorflow2.0

tensorflow-lite

quantization-aware-training

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-07-26 12:36:59

来自https://www.tensorflow.org/lite/performance/post_training_quant的报价

此外，

还支持动态量化和反量化激活，以便：

在可用时使用量化的内核来加快实现速度。图中不同部分的浮点核与量化核的混合。

如果内核具有支持量化的优化路径，则对浮点激活进行量化，以便与量化的权重一起应用。

否则，激活将保持在浮点数中，权值将转换为浮点数以进行推理。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/68522115

复制

相似问题

问动态范围量化
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问动态范围量化EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问动态范围量化
EN