首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏杨熹的专栏

    读书|《Mastering Machine Learning with Python in Six Steps》

    此处会涉及到 Multicollinearity 多重共线性问题,即多个自变量彼此强相关这时应该只使用其中一个自变量。 可以用 VIF 来检查多重共线性: 方法就是: 1.plot correlation matrix 2.Remove multicollinearity Pseudo code: vif = [variance_inflation_factor

    1K100发布于 2018-04-03
  • 来自专栏用户3246163的专栏

    2.2 线形回归

    error term的方差是恒定的 一个观察的error term和另一个观察的error term无关 error term 正态分布 23.8 解释不完美和完美多重共线性和他们的影响 Perfect multicollinearity :当一个X和另外一个X完美线性相关时就是多重共线性 Imperfect multicollinearity:当两个X相关,但不是完美相关时出现。 multicollinearity的影响: 会导致错误的得出一个变量不显著,但是实际显著的结论。

    2.2K20发布于 2018-09-14
  • 来自专栏数据分析

    [数据分析]特征工程实战:如何为模型准备高质量的输入?

    = orig_corr_matrix.max().max() else: orig_multicollinearity = 0 engineered_corr_matrix X_engineered.corr().abs() np.fill_diagonal(engineered_corr_matrix.values, 0) engineered_multicollinearity engineered': engineered_mi, 'improvement': engineered_mi - orig_mi }, 'multicollinearity ': { 'original': orig_multicollinearity, 'engineered': engineered_multicollinearity , 'improvement': engineered_multicollinearity - orig_multicollinearity }

    51311编辑于 2025-09-23
  • 来自专栏AI研习社

    不容错过的机器学习/深度学习笔试题及解析!

    A.outlook B.humidity C.windy D.temperature 答案:A 2.如果回归模型中存在多重共线性(multicollinearity),应该如何解决这一问题而不丢失太多信息

    2.1K30发布于 2019-08-09
  • 来自专栏Python中文社区

    Kaggle HousePrice 特征工程部分之统计检验

    回归的整体结果是否有意义(Ftest)    回归的数据集中的变量(Xi)是否有贡献(Ttest)    回归的可预测性R2(adjusted R2)高低   回归的数据集中的变量(Xi)是否存在多重共线性(multicollinearity Basic 小火车(Pipe测试): 0.937 Basic_PCA小火车: 0.937 回归的数据集中的变量(Xi)存在多重共线性(multicollinearity)是奇异矩阵(Singular

    1.4K100发布于 2018-02-01
  • 来自专栏深度学习

    【深度学习实验】线性模型(一):使用NumPy实现简单线性模型:搭建、构造损失函数、计算损失值

    岭回归(Ridge Regression)和Lasso回归(Lasso Regression):用于处理具有多重共线性(multicollinearity)的回归问题。

    35810编辑于 2024-07-29
  • 来自专栏DeepHub IMBA

    如何使用PCA去除数据集中的多重共线性

    作者:Satyam Kumar 原文地址:https://towardsdatascience.com/how-to-remove-multicollinearity-in-dataset-using-pca

    2.1K20发布于 2020-12-24
  • 来自专栏气python风雨

    Python基于决策树算法预测黄金价格走势

    Threshold None 25 Numeric Binning False 26 Remove Outliers False 27 Outliers Threshold None 28 Remove Multicollinearity False 29 Multicollinearity Threshold None 30 Clustering False 31 Clustering Iteration None 32 Polynomial

    51310编辑于 2024-06-20
  • 来自专栏深度学习

    【深度学习实验】线性模型(三):使用Pytorch实现简单线性模型:搭建、构造损失函数、计算损失值

    岭回归(Ridge Regression)和Lasso回归(Lasso Regression):用于处理具有多重共线性(multicollinearity)的回归问题。

    54410编辑于 2024-07-29
  • 来自专栏临床预测模型

    多重共线性检测—相关性系数矩阵和方差膨胀系数(VIF)分析学习

    多重共线性(Multicollinearity) 是在多元线性回归分析中经常遇到的一个问题,它发生在当两个或更多的预测变量(自变量)在统计模型中高度相关。

    2.4K30编辑于 2024-09-04
  • 特征泛滥:量化回归模型的生产脆弱性

    f"r = {r:.3f}", fontsize=11) ax.set_xlabel(a); ax.set_ylabel(b)plt.tight_layout()plt.savefig("01_multicollinearity.png ", dpi=150, bbox_inches="tight")plt.show()print("已保存 → 01_multicollinearity.png")这一部分展示了多重共线性,即多个特征包含几乎相同信息的情况

    13110编辑于 2026-03-10
  • 来自专栏AI研习社

    深度学习岗位面试问题一览

    Multicollinearity-Wikipedia(http://t.cn/RjVMJBf) 共线性:多变量线性回归中,变量之间由于存在高度相关关系而使回归估计不准确。

    1.8K50发布于 2018-03-16
  • 来自专栏DeepHub IMBA

    如何消除多重共线性

    作者:Irfan Alghani Khalid 原文地址:https://towardsdatascience.com/how-to-remove-multicollinearity-using-python

    2K20发布于 2021-07-01
  • 来自专栏大数据文摘

    数据科学家应该拥有的8个好习惯

    是否有multicollinearity? 数据收集是否有bias (如selection bias)?

    63650发布于 2018-05-25
  • 来自专栏新智元

    【神经网络本质是多项式回归】Jeff Dean等论文发现逻辑回归和深度学习一样好

    NN 具有多重共线性:用对 PR 的理解去理解 NN,从而对 NN 的一般特性提供了新的见解,还预测并且确认了神经网络具有多重共线性(multicollinearity),这是以前未曾在文献中报道过的。

    2K00发布于 2018-07-31
  • 来自专栏算法channel

    机器学习线性回归:谈谈多重共线性问题及相关算法

    00 基本概念 多重共线性(Multicollinearity)是指线性回归模型中的自变量之间由于存在高度相关关系而使模型的权重参数估计失真或难以估计准确的一种特性,多重是指一个自变量可能与多个其他自变量之间存在相关关系

    2.6K40发布于 2018-04-02
  • 来自专栏磐创AI技术团队的专栏

    一个完整的机器学习项目在Python中的演练(二)

    那些相互之间有很强关联性的特征被称为共线(collinear)https://en.wikipedia.org/wiki/Multicollinearity,而且消除这些“特征对”中的一个变量通常可以使机器学习模型更鲁棒并且具有更强的可解释性

    1.3K70发布于 2018-07-03
  • 来自专栏人工智能之核心基础

    人工智能之核心基础 机器学习 第三章 线性回归与逻辑回归

    y_test,y_pred))print("RMSE:",mean_squared_error(y_test,y_pred,squared=False))3.2线性回归的优化与正则化⚠️问题:多重共线性(Multicollinearity

    42710编辑于 2025-12-31
  • 来自专栏红色石头的机器学习之路

    机器学习笔试精选题精选(四)

    如果回归模型中存在多重共线性(multicollinearity),应该如何解决这一问题而不丢失太多信息(多选)? A. 剔除所有的共线性变量 B. 剔除共线性变量中的一个 C.

    1.3K10编辑于 2022-01-12
  • 来自专栏新智元

    【面试107问】谷歌等巨头机器学习面试题:从逻辑回归到智力测验

    如何解决多重共线性(Multicollinearity)? 68. 请写出推特和Facebook 上优化广告费用支出的方程。 Facebook 69. 从一副牌中抽取两张,同一花色的出现概率是多少?

    1.9K70发布于 2018-03-21
领券