我想知道为什么我们在计算偏导数时乘以2。
我指的是我在下面盘旋的2's,来自这里。

我们还在python实现中看到了这一点,m_deriv += -2*X[i] * (Y[i] - (m*X[i] + b)),有一个2。
我怎么能理解这里的直觉?
我的数学不强,所以如果这是个愚蠢的问题,请提前道歉。
发布于 2019-12-23 03:09:09
你用均方误差\Sigma\frac{1}{N}(y-(Wx+b))^2作为损失函数,如果你取导数,你就会得到2。在一些材料中,我们将使用\frac{1}{2}\Sigma\frac{1}{N}(y-(Wx+b))^2作为损失函数来抵消2。事实上,这一点都不重要,对params优化没有任何影响。
https://datascience.stackexchange.com/questions/65299
复制相似问题