我正在尝试拟合一个预测变量为TNST和Seff,响应变量为AUCMET的模型。拟合的结果为:
mdl1 =
Linear regression model:
AUCMET ~ 1 + TNST + Seff
Estimated Coefficients:
Estimate SE tStat pValue
(Intercept) 1251.5 72.176 17.34 1.4406e-58
TNST -2.3058 0.16045 -14.371 1.9579e-42
Seff 13.087 1.0748 12.176 9.4907e-32
Number of observations: 932, Error degrees of freedom: 929
Root Mean Squared Error: 322
R-squared: 0.197, Adjusted R-Squared 0.195
F-statistic vs. constant model: 114, p-value = 5.36e-45

anova分析的结果是
anova(mdl1)
ans =
SumSq DF MeanSq F pValue
TNST 2.1395e+07 1 2.1395e+07 206.52 1.9579e-42
Seff 1.5359e+07 1 1.5359e+07 148.25 9.4907e-32
Error 9.6243e+07 929 1.036e+05 诊断图的输出为
plotDiagnostics(mdl)

你能帮我解释一下这个结果吗?我看到所有的p都小于0.05,所以它们对模型很重要。它是一个好的模型吗?我应该看什么才能理解它?
发布于 2015-08-10 22:22:49
R平方/调整后的r平方是皮尔逊相关系数。https://en.m.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient
1是好的,0是坏的,所以我会说这是一个很糟糕的模型。
发布于 2015-08-10 23:54:27
编辑:现在您已经使用新信息编辑了问题:
1-从曲线图诊断测试中可以看出,有一定百分比的点具有高杠杆。但这个图并没有揭示出高杠杆点是否是异常值。尝试使用plotDiagnostics(mdl,'cookd')查找离群值(库克距离较大的点),并将其从数据中删除。
2- ANOVA表显示这两个变量都很重要,您不能考虑删除它们。
低R平方是不好的吗?
不是的。在预测人类行为(例如心理学)等领域中,由于人类的行为很难预测,因此R平方值较低。此外,如果获得的R平方很低,但预测良好,则该模型算作一个好模型。因此,低R-平方并不一定会影响对重要变量的解释。预测的R平方应该有多高?嗯,这取决于你对预测区间宽度的要求,以及你的数据中存在多大的可变性。虽然高R平方是精确预测所必需的,但正如我们将看到的那样,它本身是不够的。另一方面,高R平方值本质上并不好。高R平方并不一定表示模型具有良好的拟合能力。(read more)
下一步要做什么?
要检查模型的质量,可以执行其他测试,例如
要检查拟合模型的质量,请查阅方差分析表。
tbl = anova(mdl)诊断图可帮助您识别异常值,并查看模型或拟合中的其他问题。
plotDiagnostics(mdl)有几个残差图可以帮助您发现模型或数据中的错误、异常值或相关性。最简单的残差图是默认直方图,它显示残差的范围及其频率,以及概率图,它显示残差的分布如何与具有匹配方差的正态分布进行比较。
plotResiduals(mdl)https://stackoverflow.com/questions/31921473
复制相似问题