是否有可能重新量化已经量化的模型?
我有一些模型,我已经训练与量化感知训练(QAT)与全整数量化。但是,我没有为GPU代表团提供这些模式。是否有一种方法,使我已经拥有的模型与Float16量化,以便能够运行他们与GPU代表。
发布于 2020-09-25 06:02:58
您是否正在寻找一些方法来转换float16量化模型的整数量化模型?
您使用的是哪个版本的TFLite?TFLite 2.3支持使用GPU委托运行量化模型。但是,由于GPU只支持浮点操作,所以它在内部将整数权重量化为浮动权值。有关如何启用(实验性)量化模型支持,请参见文档。https://www.tensorflow.org/lite/performance/gpu_advanced#running_quantized_models_experimental
https://stackoverflow.com/questions/63509008
复制相似问题