16 17 187 8 9 10 11 12第一行中的计算-一次只考虑两个矩阵中的四个元素(0表示填充):
(1-8)+(2-9)+(3-10)+(4-(2-9)+(3-10)+(4-11)+(5-12): This replaces 2 in initial matrix.(3-10)+(4-11)+(5-12)+(6-0): This replaces 3 in initial matrix.(4-11)+(5-12)+(6-0)+(0-0): This replac
我对知识蒸馏了解不多。我有一个问题。 有一个模型显示了99%的性能(10class图像分类)。但我不能使用更大的模型,因为我必须保持推理时间。如果我使用另一个大模型训练知识蒸馏,是否会产生整体效应? -option-或者让我知道是否有比这更好的方法来提高性能。 enter image description here