首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >cs231n卷积神经网络

cs231n卷积神经网络
EN

Stack Overflow用户
提问于 2016-11-07 02:49:48
回答 1查看 81关注 0票数 1

我正在看斯坦福大学CS231n的在线讲座。我有个问题,也许我是因为什么原因被搞糊涂了。链接是:录像

转到35:46,在向后函数中,dx的公式是:

代码语言:javascript
复制
dx = self.y * dz. 

从那以后我就不知道了

代码语言:javascript
复制
z = x*y. 

所以

代码语言:javascript
复制
dx = dz/y

有人能解释一下为什么会发生这种差异吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-11-07 10:23:20

这只是他的代码中一个奇怪的符号(dz,dx,dy在他们通常的意义上没有使用)。变量dz表示成本函数L (完全神经网络的)对z的导数,而L关于xE 211E 112yE 213E 213注意到E 114dx<代码>E 215/代码>和E 116dyE 217。E 118z<代码>E 219/code>关于E 120E 221,即<代码>E122>代码代码给出的代码<2 2 5><2 2 5><2 2 5>。考虑到这些符号,其余的都遵循链规则。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40457100

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档