首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >stats.linregress中的r与statsmodel中的r平方比较

stats.linregress中的r与statsmodel中的r平方比较
EN

Stack Overflow用户
提问于 2018-08-08 12:40:42
回答 1查看 938关注 0票数 1

我正在编写一个程序来调查一些类星体的星等和红移之间的相关性,我正在使用statsmodelsscipy.stats.linregress来计算数据的统计量;使用statsmodels来计算r-squared (以及其他参数),使用stats.linregress来计算r (以及其他参数)。

下面是一些示例输出:

代码语言:javascript
复制
W1 r-squared: 0.855715
W1 r-value  : 0.414026
W2 r-squared: 0.861169
W2 r-value  : 0.517381
W3 r-squared: 0.874051
W3 r-value  : 0.418523
W4 r-squared: 0.856747
W4 r-value  : 0.294094
Visual minus WISE r-squared: 0.87366
Visual minus WISE r-value  : -0.521463

我的问题是,为什么rr-squared的值不匹配

(例如,对于W1频段,0.414026**2 != 0.855715)?

我的计算函数的代码如下:

代码语言:javascript
复制
def computeStats(x, y, yName):
    from scipy import stats
    import statsmodels.api as sm

    #   Compute model parameters
    model = sm.OLS(y, x, missing= 'drop')
    results = model.fit()
    #   Mask NaN values in both axes
    mask = ~np.isnan(y) & ~np.isnan(x)
    #   Compute fit parameters
    params = stats.linregress(x[mask], y[mask])
    fit = params[0]*x + params[1]
    fitEquation = '$(%s)=(%.4g \pm %.4g) \\times redshift+%.4g$'%(yName,
                params[0],  #   slope
                params[4],  #   stderr in slope
                params[1])  #   y-intercept

    print('%s r-squared: %g'%(name, arrayresults.rsquared))
    print('%s r-value  : %g'%(name, arrayparams[2]))

    return results, params, fit, fitEquation

我对统计数据的解释有误吗?或者这两个模块使用不同的方法计算回归?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-08 12:58:59

默认情况下,statsmodels中的OLS不包括线性方程中的常量项(即截距)。(常量项对应于design matrix中的一列。)

要匹配linregress,请按如下方式创建model

代码语言:javascript
复制
    model = sm.OLS(y, sm.add_constant(x), missing= 'drop')
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51738734

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档