我想用我的keras模型进行量化感知训练。我试过了,如下所示。我使用的是tensorflow 1.14.0
train_graph = tf.Graph()
train_sess = tf.compat.v1.Session(graph=train_graph)
tf.compat.v1.keras.backend.set_session(train_sess)
with train_graph.as_default():
tf.keras.backend.set_learning_phase(1)
model = my_keras_model()
tf.contrib.quantize.create_training_graph(input_graph = train_graph, quant_delay=5)
train_sess.run(tf.global_variables_initializer())
model.compile(...)
model.fit_generator(...)
saver = tf.compat.v1.train.Saver()
saver.save(train_sess, checkpoint_path)它工作正常,没有错误。
然而,保存的模型(h5和ckpt)的大小与未量化的模型完全相同。
这条路对吗?我如何检查它是否量化得很好?
或者,有没有更好的量化方法?
发布于 2020-05-06 21:37:27
当您完成量化感知训练并将模型保存到磁盘时,它实际上还没有被量化。换句话说,它已经为量化做好了“准备”,但是权重仍然是float32。您必须进一步将模型转换为TFLite,才能使其真正量化。您可以使用以下代码来完成此操作:
converter = tf.lite.TFLiteConverter.from_keras_model(model)
converter.optimizations = [tf.lite.Optimize.DEFAULT]
quantized_tflite_model = converter.convert()这将使用int8权重和uint8激活来量化您的模型。
请查看official example以获得进一步的参考。
https://stackoverflow.com/questions/60942025
复制相似问题