其中x是一个通用示例。最优系数a,b,c是用简单的矩阵演算计算出来的。首先，让我们用X = [1 | X | X^2]表示一个N行的矩阵，其中N是样本数。第一列是1s列，第二列是值x_i列，对于所有样本i，第三列是值x_i^2列，对于所有样本i，让我们用B表示以下列向量B=[a b c]^T，如果Y是所有样本I的N个目标值的列向量，我们可以将回归写成

y ~ X B

这个方程的i-th行是y_i ~ [1 x_i x^2] [a b c]^t = a + b x_i + c x_i^2。

训练回归的目标是找到B=[a b c]，以便X B尽可能接近y。

如果不添加1的列，则假设a=0是先验的，这可能是不正确的。

实际上，当您编写Python代码并将PolynomialFeatures与sklearn.linear_model.LinearRegression一起使用时，后者在默认情况下会注意添加1s列(因为在LinearRegression中，fit_intercept参数默认为True )，因此不需要在PolynomialFeatures中也添加它。因此，在PolynomialFeatures中，人们通常保留include_bias=False。

如果使用statsmodels.OLS而不是LinearRegression，情况就不一样了。

票数 19

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/59725907

复制

相似问题

问Scikit学习PolynomialFeatures - include_bias选项的用途是什么？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Scikit学习PolynomialFeatures - include_bias选项的用途是什么？EN