我对知识蒸馏了解不多。我有一个问题。 有一个模型显示了99%的性能(10class图像分类)。但我不能使用更大的模型,因为我必须保持推理时间。如果我使用另一个大模型训练知识蒸馏,是否会产生整体效应? -option-或者让我知道是否有比这更好的方法来提高性能。 enter image description here
确切的日志条目是:May 9 21:57:12 davelaptop kernel: [ 1733.316743] usb 3-3: New USB device found, idVendor=040a, idProduct=05d1
May 9 21:57:12 davelaptop kernel: [ 1733.316760] usb