发布于 2019-11-11 09:29:05
通常,对抗性示例是通过获取输出w.r.t的梯度创建的。输入,然后最大限度的损失。例如,如果您有一个猫和狗的分类任务,并且您想要创建对抗性示例,您可以在网络中输入一个256 x 256的猫图像,得到丢失w.r.t的梯度。输入,也将是一个256 x 256张量,然后添加负梯度(扰动)到你的图像,直到网络分类为狗。通过使用正确的标签对这些生成的图像进行再次训练,网络对噪声/扰动的鲁棒性更强。
还有其他更复杂的方法。例如,本论文解释了输入中的模式如何破坏光流估计网络的输出。
https://stackoverflow.com/questions/58798302
复制相似问题