我相信这有一个简单的答案!我要求提高我的理解。
图:对:CS231N反向传播的修改

如果应用凯恩规则来获得Y的增量,则梯度将是:dy = -4 (根据图表)。
应用链规则表示法:df/dy = df/dq * dq/dy
数字:
double x = -2;
double y = 5;
double q = 3;
double z = -4;
double f = -12;
double df = 1;
double dz = 3;
double dq = -4;
double dy = df * dq;
double dx = df * dq;如上所示的df = df/df = 1和上面所示的dq = df/dq = -4。因此:1(df) * -4(dq) = -4(dy).还是我完全错了?
数值是从哪里来的,图表中的哪里?这是一个仅为数值链的梯度,还是从其他输入值中导出的?我之所以在这里问这个问题,是因为在第48页上,有一个稍微令人困惑的代码示例:

我把(/)符号df/dy作为一个除法,我认为这是错误的?df/dy = df/dq * dq/dy = 1/-4 * -4/-4 = 0.25 --在这里,一个数字和另一个数字的目的是什么?
是不是df/dy = dy --它们是相同的东西,象征着dy of df,意思是在时间上流动的一个梯度?
抱歉,我有点困惑。
发布于 2017-05-27 20:57:03
https://stackoverflow.com/questions/44214017
复制相似问题