在阅读“统计学习的要素”一书的Ch-2中的线性回归时,我遇到了两个方程,我无法理解第二个方程是如何从第一个方程推导出来的。
背景:
我们如何将线性模型拟合到一组训练数据中?有许多不同的方法,但到目前为止最流行的是最小二乘法。在这种方法中,我们选择系数β来最小化残差平方和
方程式1
RSS(β)是参数的二次函数,因此它的最小值总是存在的,但可能不是唯一的。解决方案最容易用矩阵表示法来表征。我们可以写
方程式2
其中,X是N×p矩阵,每行具有一个输入向量,而y是训练集中的输出的N向量。
第一个方程式:

第二个方程式:

发布于 2020-07-20 15:37:57
这样啊,原来是这么回事。第二个方程的RHS是矩阵形式的,为了得到第一个方程,你必须转置第二个方程的RHS的一部分(这是矩阵乘法的方式)。
https://stackoverflow.com/questions/62990613
复制相似问题