我正在看斯坦福大学CS231n的在线讲座。我有个问题,也许我是因为什么原因被搞糊涂了。链接是:录像
转到35:46,在向后函数中,dx的公式是:
dx = self.y * dz. 从那以后我就不知道了
z = x*y. 所以
dx = dz/y有人能解释一下为什么会发生这种差异吗?
发布于 2016-11-07 10:23:20
这只是他的代码中一个奇怪的符号(dz,dx,dy在他们通常的意义上没有使用)。变量dz表示成本函数L (完全神经网络的)对z的导数,而L关于xE 211和E 112yE 213E 213注意到E 114dx<代码>E 215/代码>和E 116dyE 217。E 118z<代码>E 219/code>关于E 120E 221,即<代码>E122>代码代码给出的代码<2 2 5><2 2 5><2 2 5>。考虑到这些符号,其余的都遵循链规则。
https://stackoverflow.com/questions/40457100
复制相似问题