文章/答案/技术大牛

发布

社区首页 >问答首页 >在R中计算线性回归的统计检验

问在R中计算线性回归的统计检验
EN

Stack Overflow用户

提问于 2015-03-12 16:37:38

回答 3查看 148关注 0票数 2

我是Stack Overflow的新手，我也是R和统计的新手。我需要创建一个线性回归模型，基于给定数据集中的一些变量来描述汽车的重量。

wtlm=lm(weight~foreign + cylinders + displacement + hp + acceleration, data=HW2_CarData);

summary(wtlm)

我不确定如何准确地使用这个模型进行统计测试，因为我不确定这个"wtlm“是否描述了权重= B1X1 + B2X2 + ... + Error的正确LR方程。

有没有人能帮我填一下这个和做统计测试之间的差距？我需要做一个测试，以确定国产汽车是否比外国汽车更重(可能是通过使用二进制变量‘外国’)。如果是在R之外，我会尝试将汽车分为两组:一组仅限美国车，一组仅限外国车，然后尝试对来自两个不同人群的两个样本进行统计检验。

我读过很多关于在R中使用'lm‘的帮助页面，但它对我解决这个问题没有多大帮助。

此外，我还对lm(weight~foreign + cylinders + ...)和lm(formula= ...)之间的区别感到好奇

如果有人能解释这一点，那也是非常有帮助的！

regression

linear-regression

回答 3

Stack Overflow用户

发布于 2015-03-12 16:46:54

使用summary(wtlm)，您将获得汽车在重量上的“外来”B估计。T(测试值)及其相关的p值都是我们所说的“假设检验”的一部分。因此，如果p< .05 (传统性)，这意味着是的，外来，给定这个变量是二进制的，在统计上对权重有显著的“影响”。要了解影响的程度，您可以使用confint(wtlm)，它将为您提供此效果的95%置信区间。(单位反映了您的被依赖变量的单位；如果它是千克，您将知道，在保持所有其他参数不变的情况下，外国汽车平均与非外国汽车有"Beta“千克差异)

是的，这正确地表示了错误的LR模型。至于formula=，它不是强制性的；添加它不会改变任何事情。如果在它之前使用其他参数，就会发生这种情况。要了解更多信息，请阅读R函数中参数的顺序。

票数 1

Stack Overflow用户

发布于 2015-03-12 16:44:21

你提到的例子，你真的不需要为此做线性回归。

我需要做一个测试，以确定国产汽车是否比外国汽车更重(可能是通过使用二元变量‘外国’)。

让我给你举个例子。在这里，我正在测试变量"wt“是否在由" am”定义的不同组中具有不同的含义。

data(mtcars)
t.test(wt~am,data=mtcars)

票数 0

Stack Overflow用户

发布于 2017-07-31 06:14:19

我不同意上面所有的类似t-test的答案。操作员提到，他对国产和国外汽车之间的重量差异很感兴趣，并希望确定重量：

“对给定数据集中的某些变量执行...based”

因此，这些问题是关于国内和国外汽车的重量差异，并控制其他汽车特征。t-test不允许这样做，而回归(或anova)允许。

让我们使用mtcar数据集，并假设V形发动机是美国发动机(VS == 0)，S形发动机是欧洲(‘外国’发动机) (VS == 1)。

df <- mtcars
m1 <- lm(formula = wt ~ vs, data = mtcars)
summary(m1)
Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   3.6886     0.1950  18.913  < 2e-16 ***
vs           -1.0773     0.2949  -3.654  0.00098 ***

上述输出结果表明，在不考虑其他特征的情况下，欧洲汽车的平均重量(3.6886+1*-1.0773)比美国汽车(3.6886+0*-1.0733)轻。

然而，这种差异很可能归因于欧洲/美国汽车制造方式的不同。例如，美国汽车可能更可能是自动的，而不是手动的，平均而言，美国汽车可能比欧洲汽车有更多的变速箱和化油器，所有这些都构成了汽车的重量。让我们对这些因素进行建模，看看美国/欧洲的权重差异是否仍然存在。

m2 <- lm(formula = wt ~ am + as.factor(carb) + as.factor(gear) + vs, data = mtcars)
summary(m2)
Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
(Intercept)        3.5658     0.4283   8.325 3.03e-08 ***
am                -0.8585     0.4378  -1.961   0.0627 .  
as.factor(carb)2   0.1250     0.3871   0.323   0.7499    
as.factor(carb)3   0.2942     0.5257   0.560   0.5813    
as.factor(carb)4   0.9034     0.4714   1.916   0.0684 .  
as.factor(carb)6   0.7693     0.7966   0.966   0.3446    
as.factor(carb)8   1.5693     0.7966   1.970   0.0615 .  
as.factor(gear)4  -0.4427     0.5015  -0.883   0.3869    
as.factor(gear)5  -0.7066     0.6228  -1.135   0.2688    
vs                -0.3322     0.4237  -0.784   0.4413

简化输出中的最后一行现在表明，一旦考虑到汽车特性，重量差异就不能再归因于美国或欧洲的制造。它还很好地说明了这个答案与推荐的t检验(或模型m1中的单变量回归)有何本质不同。

“还有，我很好奇lm(weight~foreign + cylinders + ...)和lm(formula= ...)之间的区别。”

没有实质性的区别。前者是后者的缩写。但是，在使用简写表示法时，必须按预期顺序提供元素(公式、数据等)(请参阅?lm)。。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/29005100

复制

相似问题

问在R中计算线性回归的统计检验
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在R中计算线性回归的统计检验EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在R中计算线性回归的统计检验
EN