首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在R中计算线性回归的统计检验

在R中计算线性回归的统计检验
EN

Stack Overflow用户
提问于 2015-03-12 16:37:38
回答 3查看 148关注 0票数 2

我是Stack Overflow的新手,我也是R和统计的新手。我需要创建一个线性回归模型,基于给定数据集中的一些变量来描述汽车的重量。

wtlm=lm(weight~foreign + cylinders + displacement + hp + acceleration, data=HW2_CarData);

summary(wtlm)

我不确定如何准确地使用这个模型进行统计测试,因为我不确定这个"wtlm“是否描述了权重= B1X1 + B2X2 + ... + Error的正确LR方程。

有没有人能帮我填一下这个和做统计测试之间的差距?我需要做一个测试,以确定国产汽车是否比外国汽车更重(可能是通过使用二进制变量‘外国’)。如果是在R之外,我会尝试将汽车分为两组:一组仅限美国车,一组仅限外国车,然后尝试对来自两个不同人群的两个样本进行统计检验。

我读过很多关于在R中使用'lm‘的帮助页面,但它对我解决这个问题没有多大帮助。

此外,我还对lm(weight~foreign + cylinders + ...)lm(formula= ...)之间的区别感到好奇

如果有人能解释这一点,那也是非常有帮助的!

EN

回答 3

Stack Overflow用户

发布于 2015-03-12 16:46:54

使用summary(wtlm),您将获得汽车在重量上的“外来”B估计。T(测试值)及其相关的p值都是我们所说的“假设检验”的一部分。因此,如果p< .05 (传统性),这意味着是的,外来,给定这个变量是二进制的,在统计上对权重有显著的“影响”。要了解影响的程度,您可以使用confint(wtlm),它将为您提供此效果的95%置信区间。(单位反映了您的被依赖变量的单位;如果它是千克,您将知道,在保持所有其他参数不变的情况下,外国汽车平均与非外国汽车有"Beta“千克差异)

是的,这正确地表示了错误的LR模型。至于formula=,它不是强制性的;添加它不会改变任何事情。如果在它之前使用其他参数,就会发生这种情况。要了解更多信息,请阅读R函数中参数的顺序。

票数 1
EN

Stack Overflow用户

发布于 2015-03-12 16:44:21

你提到的例子,你真的不需要为此做线性回归。

我需要做一个测试,以确定国产汽车是否比外国汽车更重(可能是通过使用二元变量‘外国’)。

让我给你举个例子。在这里,我正在测试变量"wt“是否在由" am”定义的不同组中具有不同的含义。

代码语言:javascript
复制
data(mtcars)
t.test(wt~am,data=mtcars)
票数 0
EN

Stack Overflow用户

发布于 2017-07-31 06:14:19

我不同意上面所有的类似t-test的答案。操作员提到,他对国产和国外汽车之间的重量差异很感兴趣,并希望确定重量:

“对给定数据集中的某些变量执行...based”

因此,这些问题是关于国内和国外汽车的重量差异,并控制其他汽车特征。t-test不允许这样做,而回归(或anova)允许。

让我们使用mtcar数据集,并假设V形发动机是美国发动机(VS == 0),S形发动机是欧洲(‘外国’发动机) (VS == 1)。

代码语言:javascript
复制
df <- mtcars
m1 <- lm(formula = wt ~ vs, data = mtcars)
summary(m1)
Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   3.6886     0.1950  18.913  < 2e-16 ***
vs           -1.0773     0.2949  -3.654  0.00098 ***

上述输出结果表明,在不考虑其他特征的情况下,欧洲汽车的平均重量(3.6886+1*-1.0773)比美国汽车(3.6886+0*-1.0733)轻。

然而,这种差异很可能归因于欧洲/美国汽车制造方式的不同。例如,美国汽车可能更可能是自动的,而不是手动的,平均而言,美国汽车可能比欧洲汽车有更多的变速箱和化油器,所有这些都构成了汽车的重量。让我们对这些因素进行建模,看看美国/欧洲的权重差异是否仍然存在。

代码语言:javascript
复制
m2 <- lm(formula = wt ~ am + as.factor(carb) + as.factor(gear) + vs, data = mtcars)
summary(m2)
Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
(Intercept)        3.5658     0.4283   8.325 3.03e-08 ***
am                -0.8585     0.4378  -1.961   0.0627 .  
as.factor(carb)2   0.1250     0.3871   0.323   0.7499    
as.factor(carb)3   0.2942     0.5257   0.560   0.5813    
as.factor(carb)4   0.9034     0.4714   1.916   0.0684 .  
as.factor(carb)6   0.7693     0.7966   0.966   0.3446    
as.factor(carb)8   1.5693     0.7966   1.970   0.0615 .  
as.factor(gear)4  -0.4427     0.5015  -0.883   0.3869    
as.factor(gear)5  -0.7066     0.6228  -1.135   0.2688    
vs                -0.3322     0.4237  -0.784   0.4413

简化输出中的最后一行现在表明,一旦考虑到汽车特性,重量差异就不能再归因于美国或欧洲的制造。它还很好地说明了这个答案与推荐的t检验(或模型m1中的单变量回归)有何本质不同。

“还有,我很好奇lm(weight~foreign + cylinders + ...)lm(formula= ...)之间的区别。”

没有实质性的区别。前者是后者的缩写。但是,在使用简写表示法时,必须按预期顺序提供元素(公式、数据等)(请参阅?lm)。。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29005100

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档