我是Stack Overflow的新手,我也是R和统计的新手。我需要创建一个线性回归模型,基于给定数据集中的一些变量来描述汽车的重量。
wtlm=lm(weight~foreign + cylinders + displacement + hp + acceleration, data=HW2_CarData);
summary(wtlm)
我不确定如何准确地使用这个模型进行统计测试,因为我不确定这个"wtlm“是否描述了权重= B1X1 + B2X2 + ... + Error的正确LR方程。
有没有人能帮我填一下这个和做统计测试之间的差距?我需要做一个测试,以确定国产汽车是否比外国汽车更重(可能是通过使用二进制变量‘外国’)。如果是在R之外,我会尝试将汽车分为两组:一组仅限美国车,一组仅限外国车,然后尝试对来自两个不同人群的两个样本进行统计检验。
我读过很多关于在R中使用'lm‘的帮助页面,但它对我解决这个问题没有多大帮助。
此外,我还对lm(weight~foreign + cylinders + ...)和lm(formula= ...)之间的区别感到好奇
如果有人能解释这一点,那也是非常有帮助的!
发布于 2015-03-12 16:46:54
使用summary(wtlm),您将获得汽车在重量上的“外来”B估计。T(测试值)及其相关的p值都是我们所说的“假设检验”的一部分。因此,如果p< .05 (传统性),这意味着是的,外来,给定这个变量是二进制的,在统计上对权重有显著的“影响”。要了解影响的程度,您可以使用confint(wtlm),它将为您提供此效果的95%置信区间。(单位反映了您的被依赖变量的单位;如果它是千克,您将知道,在保持所有其他参数不变的情况下,外国汽车平均与非外国汽车有"Beta“千克差异)
是的,这正确地表示了错误的LR模型。至于formula=,它不是强制性的;添加它不会改变任何事情。如果在它之前使用其他参数,就会发生这种情况。要了解更多信息,请阅读R函数中参数的顺序。
发布于 2015-03-12 16:44:21
你提到的例子,你真的不需要为此做线性回归。
我需要做一个测试,以确定国产汽车是否比外国汽车更重(可能是通过使用二元变量‘外国’)。
让我给你举个例子。在这里,我正在测试变量"wt“是否在由" am”定义的不同组中具有不同的含义。
data(mtcars)
t.test(wt~am,data=mtcars)发布于 2017-07-31 06:14:19
我不同意上面所有的类似t-test的答案。操作员提到,他对国产和国外汽车之间的重量差异很感兴趣,并希望确定重量:
“对给定数据集中的某些变量执行...based”
因此,这些问题是关于国内和国外汽车的重量差异,并控制其他汽车特征。t-test不允许这样做,而回归(或anova)允许。
让我们使用mtcar数据集,并假设V形发动机是美国发动机(VS == 0),S形发动机是欧洲(‘外国’发动机) (VS == 1)。
df <- mtcars
m1 <- lm(formula = wt ~ vs, data = mtcars)
summary(m1)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.6886 0.1950 18.913 < 2e-16 ***
vs -1.0773 0.2949 -3.654 0.00098 ***上述输出结果表明,在不考虑其他特征的情况下,欧洲汽车的平均重量(3.6886+1*-1.0773)比美国汽车(3.6886+0*-1.0733)轻。
然而,这种差异很可能归因于欧洲/美国汽车制造方式的不同。例如,美国汽车可能更可能是自动的,而不是手动的,平均而言,美国汽车可能比欧洲汽车有更多的变速箱和化油器,所有这些都构成了汽车的重量。让我们对这些因素进行建模,看看美国/欧洲的权重差异是否仍然存在。
m2 <- lm(formula = wt ~ am + as.factor(carb) + as.factor(gear) + vs, data = mtcars)
summary(m2)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.5658 0.4283 8.325 3.03e-08 ***
am -0.8585 0.4378 -1.961 0.0627 .
as.factor(carb)2 0.1250 0.3871 0.323 0.7499
as.factor(carb)3 0.2942 0.5257 0.560 0.5813
as.factor(carb)4 0.9034 0.4714 1.916 0.0684 .
as.factor(carb)6 0.7693 0.7966 0.966 0.3446
as.factor(carb)8 1.5693 0.7966 1.970 0.0615 .
as.factor(gear)4 -0.4427 0.5015 -0.883 0.3869
as.factor(gear)5 -0.7066 0.6228 -1.135 0.2688
vs -0.3322 0.4237 -0.784 0.4413简化输出中的最后一行现在表明,一旦考虑到汽车特性,重量差异就不能再归因于美国或欧洲的制造。它还很好地说明了这个答案与推荐的t检验(或模型m1中的单变量回归)有何本质不同。
“还有,我很好奇
lm(weight~foreign + cylinders + ...)和lm(formula= ...)之间的区别。”
没有实质性的区别。前者是后者的缩写。但是,在使用简写表示法时,必须按预期顺序提供元素(公式、数据等)(请参阅?lm)。。
https://stackoverflow.com/questions/29005100
复制相似问题