首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >线性回归的多重共线性与完全共线性

线性回归的多重共线性与完全共线性
EN

Data Science用户
提问于 2021-10-25 22:17:39
回答 4查看 570关注 0票数 3

我一直在试图了解自变量内的多重共线性对线性回归模型的影响。维基百科网页建议,只有当有一个“完美”的多重共线性,其中一个自变量将不得不从培训中删除。

现在我的问题是,如果相关性等于+/- 1,我们应该只删除其中的一列,还是考虑一个阈值(比如0.90),然后它应该被认为是完美的多重共线性。

EN

回答 4

Data Science用户

发布于 2021-10-26 01:06:05

这取决于上下文。计算上,只有+/- 1的相关性是有问题的,因为这样OLS准则就没有唯一的解决方案。预测变量之间非常强的相关性可能会放大标准误差。这表明,在多重共线性的情况下,参数估计的精度较低。预测的准确性通常不会因此受到太大的影响,但是如果你想要进行推断(例如,重要性测试),这可能是一个更大的问题。如果预测因子有很强的相关性,那么您可能会更好地选择您的回归模型的最佳预测因子,或者首先进行某种降维(例如,PCA)。

票数 6
EN

Data Science用户

发布于 2021-10-26 09:32:56

通常使用方差通货膨胀系数(VIF)来确定某些变量是否(过强)相关。VIF = 10是一个公认的包含/排除变量的阈值。因此,与“太高”相关性的变量也应排除在线性回归("OLS"),如描述的这里这里

票数 3
EN

Data Science用户

发布于 2021-10-26 14:44:35

多重性不一定是回归的问题,它只是生活中的一个事实。除非你能使用一个设计好的实验,否则“在自然界”的变量往往是相互关联的,你必须接受这一点。当然,如果自然是正交的(统计)生命会更简单.

所有这些都在我们的姐妹站点交叉验证中进行了大量讨论,例如参见多重共线性真的是个问题吗?

多重共线性与微数字14上有一个经济学博客,取笑不必要的对colinearity的关注。

票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/103498

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档