我目前正在测试用TensorFlow Lite转换的U-Net网络推理的延迟时间。在一个分段问题上,我正在测试具有相同结构的三个NN (我正在用Windows操作系统在我的笔记本上测试它们):
实际上,第二个模型(使用TFLite优化)将第一个模型(普通TF模型)的时间性能提高了x3的一倍(快三倍)。然而,第三种模型(TFLite &量子化)在时间上性能最差.它甚至比第一个模型(普通TF模型)慢。
为什么量化模型是最慢的?
https://stackoverflow.com/questions/65630621
复制相似问题