我正在处理一些选举数据,试图将其按“国家”和“选举”分开。我运行了一个对状态和年份有固定影响的回归(如下面所示),获得了我的汇总数据,并一直试图使用resid()函数来提取残差。
m5 <- lm(demVote ~ state*year, data=presidentialElections)
plot(resid(m5) ~ fitted(m5))
resid.m5 <- resid(m5)我认为这一切都是完美的。然而,这里是我迷失的地方--如果我做了总结(resid.m5)(我把提取的残差放在这里,或者我这样想),我似乎找不到我的因子名了。如果我想查看每个州或每一年的剩余值(例如,按州/年计算的平均值),那么如何使用resid()函数访问该值?谢谢!
发布于 2014-02-01 10:49:59
正如在前面的评论中所说的,您必须认识到,正在返回的残差与您在数据集中的观察结果的顺序相同。
下面是一个使用每个R安装附带的虹膜数据集的示例(可能是非常荒谬的回归):
data(iris)
m5 <- lm(Sepal.Length ~ Species*Sepal.Width, data=iris)
resid.m5 <- resid(m5)
dta.complete <- data.frame(iris, r.m5=resid.m5)在这里,残差与原始数据相结合。这也许有点不正统,但为什么不把事情放在一起呢?现在,您可以任意使用所有的经典子集。例如:
with(dta.complete, by(r.m5, Species, mean))祝好运!
https://stackoverflow.com/questions/21496472
复制相似问题