我正在尝试实现基于生成对抗性网络的照片真实感单图像超分辨率中描述的模型,其中作者在第3.2节中说
我们将LR输入图像的范围缩放到0,1,将HR图像缩放到−1,1。在此基础上,计算了强度范围−1,1图像的最小均方损耗。
现在我知道,当灰度图像用浮子表示时,它的值在范围0,1中,但是如何在0,1和-1,1的范围内缩放您的彩色图像?为什么作者要用两种不同的尺度来输入和高分辨率的图像?
任何见解都会有帮助。
发布于 2019-07-26 09:41:31
您可以使用下列刻度
用于重新缩放到[0,1]或[-1,1]。
输入的重标度试图将权重范围保持在一个小范围内。从理论上讲,没有必要重新确定您的输入,因为它可以通过适当地重新定义您的权重来补偿。实际上,它很重要,因为您的权重可能占用非常大的范围内的值。
为了理解这一点,我将构造一个带有两个输入的玩具示例x_1= 1和x_2=1以及一个简单的线性回归y_n=w_1x_{1n}+w_2x_{2n}。假设权重的真实值是w_1=1和w_2=1。现在,假设我们有相同的数据集,但是对于x_1和x_2有不同的尺度,比如x_1=10^k和x_2=10^{-k}。为了获得相同的输入,我们需要有逆权值,从而得到w_1=10^{-k}和w_2=10^k。从理论上讲,这并不是什么大问题,但实际上,对于k的大值,我们需要使用在10^{-k}和10^k之间存储数值的变量。
我不知道为什么引用论文的作者使用特定的转换。两者都应该导致几乎相同的性能,因为偏差应该能够补偿额外的-1和反应可以补偿每个输入的权重。由于许多优化技术的随机性以及最终解很可能不是全局最优解,所以可能会有差异。如果我想将我的模型和论文中的特定模型进行比较,我会选择一个而不是另一个。在这种情况下,我将使用与论文中使用的相同的转换。
您还可以使用不同的比例,以便通过查看转换后的值来更好地区分输入类型(低分辨率和高分辨率)。
https://datascience.stackexchange.com/questions/56377
复制相似问题