我对知识蒸馏了解不多。我有一个问题。 有一个模型显示了99%的性能(10class图像分类)。但我不能使用更大的模型,因为我必须保持推理时间。如果我使用另一个大模型训练知识蒸馏,是否会产生整体效应? -option-或者让我知道是否有比这更好的方法来提高性能。 enter image description here
/-cityname/result,9-10 (digits may be any numbers from 1 to N)example.com/vm-search/level1category/level2category-citynameexample.comlevel2category/level3category-cityn