首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏CDA数据分析师

    EViews、Stata、回归分析……10月论坛答疑精选!

    问题6:我有10个控制变量需要加到回归方程里面,可以加一个,也可以加2个,甚至全部加,我想者10个变量的每一种排列组合方式都运算一次回归。 问题7: 回归分析如何确定变量之间的因果关系? 精彩回答: 这里回答简单回归分析吧! 简单回归分析通常假定扰动项条件零均值E(u|x)=0(解释变量外生),其目的就是为了确定x对y的影响不受其他条件干扰。 多元回归分析中明确提出从u中分离更多的相关因素,OLS的这个工具使得多元回归系数的含义具有排除控制的其他变量影响的特性,因此正确的回归模型设定下显著的回归系数通常被赋予因果关系的证据。 问题10:有人说:“统计就像比基尼,露出来的部分固然诱人,没露出来的才是致命的”,大家如何理解这句话?

    3.9K80发布于 2018-02-24
  • 来自专栏全栈程序员必看

    回归分析数学建模_matlab 回归分析

    一元线性回归 变量之间的关系大致可分为两大类: 确定性的关系:可以用精确的函数关系来表达。例如矩形面积S与边长a,b的关系。 回归分析就是研究相关关系的一种重要的数理统计方法. 一元正态线性回归模型 只有两个变量的回归分析, 称为一元回归分析; 超过两个变量时称为多元回归分析 变量之间成线性关系时, 称为线性回归; 变量间不具有线性关系时, 称为非线性回归.

    71120编辑于 2022-11-15
  • 来自专栏小明的博客

    回归分析

    这种方法叫回归分析(确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法)。 自变量的数量:一元回归和多元回归分析。 线性关系:线性回归分析和非线性回归分析。 一元线性回归:只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示。 多重线性回归分析:如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关。 常用方法 线性回归 线性回归模型通常是处理因变量是连续变量的问题。最小二乘法是用于拟合回归线最常用的方法。对于观测数据,它通过最小化每个数据点到线的垂直偏差平方和来计算最佳拟合线。 通常,多项式回归的方法是通过增加特征的方法,将高次项变换为1次项,从而将多项式回归问题转化为线性回归问题。 逐步回归(Stepwise Regression) 在处理多个自变量时,可以使用逐步回归。 (一般会通过以自变量或者观测量为横坐标去绘制残差图,对拟合效果进行评价) SST=SSR+SSE 图片 模型评价 回归分析在数据量远大于特征数量时往往能表现出比较优良的效果,但是需要注意的是线性模型对于特征之间的共线性非常敏感

    1.2K20编辑于 2022-09-05
  • 来自专栏联远智维

    回归分析(二)——符号回归

    遗传编程解决符号回归问题 符号回归(Symbolic Regression)作为一种一种监督学习方法,试图发现某种隐藏的数学公式,以此利用特征变量预测目标变量。 符号回归的优点就是可以不用依赖先验的知识或者模型来为非线性系统建立符号模型。 符号回归基于进化算法,它的主要目标就是利用进化方法综合出尽可能好的解决用户自定义问题的方法(数学公式,计算机程序,逻辑表达式等)。 用Python gplearn 解决符号回归问题 Python gplearn 工具箱在进行符号回归时函数库中函数有:'add':加法 'sub':减法 'mul':乘法 'div':除法 'sqrt 附:张统一(19届疲劳断裂会议)解决符号回归方法

    4.1K20编辑于 2022-01-20
  • 来自专栏算法channel

    回归分析简介

    在介绍机器学习中回归分析的基本概念,包括什么是回归分析,线性回归,别忘了还有非线性回归,OLS能很好地解决特征间无线性相关性的问题,但是对多重线性回归任务会失真。 2 多元回归 回归分析按照涉及的变量,即机器学习中特征的个数,分为一元回归和多元回归分析,如果预测的特征仅有一个,则为一元回归,否则为多元回归。 3 线性回归 如果自变量和因变量之间是线性关系,则为线性回归分析,否则为非线性回归分析。 如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。不要小看一元线性回归分析,一个问题解决的开始往往都是从一元线性回归。 以上介绍了回归分析的一些基础内容,接下来,我们开始阐述线性回归分析之最小二乘法(OLS)。

    1K60发布于 2018-04-02
  • 来自专栏祥子的故事

    Tensorflow | 回归分析

    用tensorflow来做回归分析,基于梯度下降法 这里以一元回归分析为例子来说明如何用tensorflow实现回归分析。 1、产生数据 采用随机的方式来产生。 初始化 init = tf.global_variables_initializer() #启动图计算 sess = tf.Session() sess.run(init) 迭代计算,迭代100步,每10 次输出一个结果 for step in range(100): sess.run(train) if step % 10 == 0: print(step, sess.run (W), sess.run(b)) 结果: 0 [ 0.13928029] [ 0.30465567] 10 [ 0.10003368] [ 0.29671374] 20 [ 0.10003368 完整的代码见github: https://github.com/zhangdm/machine-learning-summary/tree/master/tensorflow/回归

    90832发布于 2019-02-18
  • 来自专栏老齐教室

    回归分析(3)

    注:本文是回归分析专题的第三部分,此专题是对即将于2021年5月出版的《机器学习数学基础》的补充和提升资料。 并且,只要插入的公式多点,在微信的编辑器中就不能保存。所以,发布的文章中,就很少有公式了。 这就失去了数学味道,如果要看完整的,请移步到网站:https://qiwsir.gitee.io/mathmetics/ ---- 用程序实现参数估计 如果使用最小二乘法实现一元线性回归系数估计,即(10 import pandas as pd import matplotlib.pyplot as plt alpha = np.arange(2,90)*np.pi/180+np.random.rand()/10 coef 回归系数估计值 std err 回归系数估计值的标准误差 t t检验值。度量统计学上重要程度的量。 P > t P值。 在时间序列分析中通常很重要 Cond. No 多重共线性检验(如果与多个参数拟合,则参数彼此相关) 如此,即可实现统计中的线性回归模型构建。

    1.7K20发布于 2021-03-11
  • 来自专栏机器学习算法与理论

    回归分析

    回归:可以对复杂和非线性的数据进行建模;适用数值型和标称型数据。 1、 CART:classification and regression trees(分类回归树)。 回归树(连续型)分类树(离散型): 回归树:假设叶节点是常数值,这种策略认为数据中的复杂关系可以用树结构来概括。 度量数据的一致性:在给定节点时计算数据的混乱度。 用该误差计算准则,去构建数据集上的回归树。 实现choosebestsplit的切分:用最佳方式切分数据集,生成对应的叶节点,即切分后误差最小。

    95360发布于 2018-04-10
  • 来自专栏CSDN搜“看,未来”

    线性回归分析

    本文仅用于我自己复习准备期末考之用 1、多元线性回归分析 多元线性回归分析 2、补充 ? ? ? ? 残差分析 残差正态性的频率检验 残差正态性的频率检验是一种很直观的检验方法,其基本思想是将残差落在某范围的频率与正态分布在该范围的概率相比较,通过二者之间偏差大小评估残差的正态性。 残差的正太概率图检验 残差图分析 残差图是指以残差为纵坐标,以任何其他指定的量为横坐标的散点图。

    80420发布于 2020-08-26
  • 来自专栏优雅R

    「R」回归分析

    从许多方面来看,回归分析是统计学的核心。它其实是一个广义的概念,通指那些用一个或多个预测变量(也称为自变量或解释变量)来预测响应变量(也成因变量、效标变量或结果变量)。 有统计表明,R中做回归分析的函数已经超过200个(http://cran.r-project.org/doc/contrib/Ricci-refcardregression.pdf)。 例如,log(y) ~ x + z + w 除了lm(),下表列出了一些有用的分析函数,对拟合得到的模型做进一步的处理和分析。 多元线性回归 这个分析稍微复杂些,我们将以基础包中的state.x77数据集为例,用来探索余下章节。比如此处我们想探究一个州的犯罪率和其他因素的关系。 深层次分析 交叉验证 对于OLS回归,通过使得预测误差(残差)平方和最小和对响应变量的解释度(R平方)最大,可以获得模型参数。

    2K32发布于 2020-07-03
  • 来自专栏YoungGy

    R语言_回归分析

    R里面已经包含了众多的回归 为了解释OLS模型的参数,数据必须满足以下统计假设: 评估模型的方法 #lm拟合回归模型 #简单线性回归 fit = lm(weight~height,data= residuals(fit))) plot(women$height,women$weight, xlab="hight", ylab="weight") abline(fit) #多项式回归 data=women, spread=FALSE, lty.smooth=2, pcj=19) #多元线性回归 ") fit = lm(Murder~Population+Illiteracy+Income+Frost, data=states) summary(fit) #有交互项的多元线性回归 effects") library(effects) plot(effect("hp:wt",fit,xlevels=list(wt=c(2.2,3.2,4.2))),multiline=TRUE) #回归推断

    1.4K20发布于 2019-05-26
  • 来自专栏联远智维

    回归分析初步(一)

    回归回归(Regression)过程主要研究和解决的问题是识别和分析出隐藏在实验数据中的数学关系。 回归作为科学研究的一种手段,通过获取已有的实验数据,获取某个实验过程的公式或者模型,再应用到实际中去。 符号回归(SymbolicRegression)的优点就是可以不用依赖先验的知识或者模型来为非线性系统建立符号模型。 符号回归基于进化算法,它的主要目标就是利用进化方法综合出尽可能好的解决用户自定义问题的方法(数学公式,计算机程序,逻辑表达式等)。 因为加速度恒定的直线运动,位移与时间的关系符合二次规律,因此根据实验测得的10个数据点,我们得到小车的运动规律如下图所示。

    73040编辑于 2022-01-20
  • 来自专栏张俊红

    多元回归分析

    总第176篇/张俊红 01.前言 前面我们讲了一元线性回归,没看过的可以先去看看:一元线性回归分析。这一篇我们来讲讲多元线性回归。 一元线性回归就是自变量只有一个x,而多元线性回归就是自变量中有多个x。 多元回归的形式如下: 02.参数估计 多元回归方程中各个参数也是需要估计的,关于为什么要估计,其实我们在一元线性回归里面也讲过。 与一元线性回归不同的是,一元线性回归拟合的是一条线,而多元回归拟合的是一个面。使用的方法也是最小二乘法。 03.拟合程度判断 在多元回归里面拟合程度判断与一元回归也类似,也主要有总平方和、回归平方和、残差平方和这三种。 多元回归里面也有R^2,R^2 = SSR/SST = 1 - SSE/SST。 你还可以看: 聊聊置信度与置信区间 统计学的假设检验 一元线性回归分析 方差分析 多因素方差分析 卡方检验讲解 多重比较法-LSD

    1.8K40发布于 2019-11-07
  • 来自专栏黄成甲

    数据分析回归分析

    文/黄成甲 相关性分析回归分析的联系与区别 相关性分析回归分析的联系是:两者均为研究及测度两个或两个以上变量之间关系的方法。 相关分析回归分析的区别是: (1)相关分析研究的都是随机变量,并且不分因变量和自变量;回归分析研究的变量要定义出自变量和因变量,并且自变量是确定的普通变量,因变量是随机变量。 (2)相关分析主要是描述两个变量之间相关关系的密切程度;回归分析不仅可以揭示变量X对变量Y的影响程度,还可以根据回归模型进行预测。 回归分析模型主要包括线性回归及非线性回归两种。 10)偏最小二乘回归 偏最小二乘回归也可以用于解决自变量之间高度相关的问题。但比主成分回归和岭回归更好的一个优点是,偏最小二乘回归可以用于例数很少的情形,甚至例数比自变量个数还少的情形。 通常,统计软件应至少能同时进行不小于10个变量的上千个数据点的分析、综合、对比与预测。 2.SAS软件系统 SAS软件系统于20世纪70年代由美国SAS研究所开发。

    4.1K51发布于 2018-09-12
  • 来自专栏深度学习之tensorflow实战篇

    windows10 tensorflow(二)原理实战之回归分析,深度学习框架(梯度下降法求解回归参数)

    windows10 tensorflow(二)原理实战之回归分析,深度学习框架(梯度下降法求解回归参数) TF数据生成方式:参考TF数据生成12法 TF基本原理与概念理解: tensorflow (一)windows 10 64位安装tensorflow1.4与基本概念解读tf.global_variables_initializer 模型: 一个简单的线性回归y = W * x + b,采用numpy 构建完整回归数据,并增加干扰噪声 import numpy as np #建立一个一元线性回归方程y=0.1x1+0.3 ,同时一个正太分布偏差np.random.normal(0.0,0.03)用于见证 因此采用梯度下降法来迭代求解数据 import tensorflow as tf import math #一、创建graph数据 #随便构建一个一元回归方程的参数W与b W=tf.Variable(tf.random_uniform

    77560发布于 2018-03-19
  • 来自专栏老齐教室

    回归分析专题(1)

    说明: 回归,是机器学习中的一个重要算法,也是统计学中研究变量关系的一个重要工具。《机器学习数学基础》 中在多处对回归分析有关原理给予了介绍。但是,限于篇幅和内容顺序的限制,书中的介绍专题性还不强。 在这里,决定以专题的形式,对回归分析基于全面介绍,包括理论分析、机器学习中的应用和实现案例等。本文作为专题的第一部分,主要介绍回归的历史研究。 ---- 在统计学中,经常要研究变量之间的关系。 回归分析是研究相关关系的一种数学工具,能够帮助我们从一个变量取得的值去估计另一个变量所取的值。 高尔顿的研究 最早对回归问题进行研究的是英国遗传学家高尔顿爵士(Sir Francis Galton)。 但,这个结论的前提是已经承认了“回归均值”现象,依据 线性回归的假设而得到结论,并非因果性上的完全解释。 参考文献 [1]. https://baike.baidu.com/item/姚沁蕾/531809 [2]. https://ccjou.wordpress.com/2014/06/10/回歸均值/ [

    1.1K20发布于 2021-03-11
  • 来自专栏大猫的R语言课堂

    10行代码搞定【滚动回归

    写 在前面 “ 对于任意一天t,在[t - n, t]的区间内进行回归。 如果数据一共有N天,那么就会得到N - n个数据点 这就是滚动回归,一个非常容易理解而且在研究中常常遇见,然而实现起来却不是那么容易的问题。在今天的大猫课堂中,大猫教大家用10行代码搞定它! 现在我们逐一分析这几行代码。 关于.SD的具体使用可以见上期《一行代码搞定分组回归》 rbindlist()语句:上面对于每一天t我们都生成了一个回归,rbindlist语句将这些回归结果打包起来输出。 总 结 是不是很简单? 但是,这个滚动回归的代码也不是完美的,最大的劣势就在于我们的滚动窗口是用“期”而不是用“天”来定义的,也就是说,程序在每次滚动的时候都会固定找前面n期的观测,而不管这n期之间可能间隔的是10天,20天还是一个月

    2.4K20发布于 2020-10-23
  • 来自专栏图像处理与模式识别研究所

    SPSS实现线性回归分析和非线性回归分析的图表。

    1、点击[文件] 2、点击[新建] 3、点击[数据] 4、点击[文本] 5、点击[图形] 6、点击[旧对话框] 7、点击[散点/点状] 8、点击[简单分布] 9、点击[定义] 10 、点击[->] 11、点击[VAR00003] 12、点击[->] 13、点击[确定] 14、点击[分析] 15、点击[回归] 16、点击[线性] 17、点击[->] 18、点击[VAR00003

    1.6K20编辑于 2022-05-28
  • 来自专栏优雅R

    「R」回归和相关分析

    问题 你想要做线性回归和/或相关分析。 10.1458220 -0.09459239 相关 # 相关系数 cor(dat$x, dat$y) #> [1] -0.7695378 相关矩阵(多个变量) 我们也可以对多个配对变量进行相关分析操作 dat), 2) #> x y z #> x 1.00 -0.77 0.49 #> y -0.77 1.00 0.00 #> z 0.49 0.00 1.00 线性回归 线性回归,当datx是预测变量时,daty为响应变量。 (多元线性回归) 使用y作为线性回归的响应变量,x和z作为预测变量。

    1K10发布于 2020-07-06
  • 来自专栏毛利学Python

    一元回归分析

    什么是回归分析 回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 运用十分广泛,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。 如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。 如果回归分析中包括两个或两个以上的自变量,且自变量之间存在线性相关,则称为多重线性回归分析。 model.intercept_ + 0.01np.sum(np.square(y2 - y1)) # 16.64430773735106 还是画个图 plt.figure(figsize=(10,10

    1.3K30发布于 2019-08-29
领券