plot.lm()如何确定残差和贴图的异常点(也就是标记的点)?我在文档中发现的唯一一件事是:
详细信息 子标题-默认情况下函数调用-显示为一个副标题(在x轴标题下)在每一个绘图是在单独的页面上,或作为一个副标题在外部边缘(如果有的话)有多个情节每页。 “标度-位置”图,也称为“扩展-位置”或“S”图,取绝对值残差的平方根,以减小偏斜度(sqrt(x~+E~*)),远小于高斯零均值E_(0-均值E)。 “S”、“Q-Q”和“剩余杠杆图”使用方差相同的标准化残差(假设下)。它们作为Ri / (s * sqrt(1 - h.ii))给出,其中h.ii是hat矩阵的对角线项,影响()$hat(也见hat),剩余杠杆图对Ri使用标准的Pearson残差(residuals.glm(type = "pearson"))。 剩余杠杆图显示了相等库克距离的等高线,值为cook.levels (默认为0.5和1),忽略了带有警告的杠杆情况。如果杠杆是常数(在平衡的aov情况下通常是这样),则图中使用因子级组合,而不是x轴的杠杆。(因子水平按平均拟合值排序。) 在库克的距离与杠杆/(1-杠杆)图,等量的标准化残差的轮廓是通过原点的线。等高线用震级标出。
但是它并没有说明残差和拟合图是如何生成的,以及它如何选择要标记的点。
更新:李哲元的答案表明,残差与贴图的方式--这些点实际上只是看了3个最大残差的点。情况确实如此。下面的“极端”例子可以证明这一点。
x = c(1,2,3,4,5,6)
y = c(2,4,6,8,10,12)
foo = data.frame(x,y)
model = lm(y ~ x, data = foo)

发布于 2016-08-31 21:31:59
它们定位最大的3个绝对标准化残差。考虑一下这个例子:
fit <- lm(dist ~ speed, cars)
plot(fit, which = 1)

r <- rstandard(fit) ## get standardised residuals
order(abs(r), decreasing = TRUE)[1:3]
# [1] 49 23 35发布于 2019-11-20 01:35:40
这是三个绝对最高的拟合值
r <- abs(selectedMod$residuals)
order((r), decreasing = TRUE)[1:3]https://stackoverflow.com/questions/39259252
复制相似问题