问为什么在提取残差时找不到我的因子名？
EN

Stack Overflow用户

提问于 2014-02-01 09:46:12

回答 1查看 105关注 0票数 0

我正在处理一些选举数据，试图将其按“国家”和“选举”分开。我运行了一个对状态和年份有固定影响的回归(如下面所示)，获得了我的汇总数据，并一直试图使用resid()函数来提取残差。

m5 <- lm(demVote ~ state*year, data=presidentialElections)

plot(resid(m5) ~ fitted(m5))
resid.m5 <- resid(m5)

我认为这一切都是完美的。然而，这里是我迷失的地方--如果我做了总结(resid.m5)(我把提取的残差放在这里，或者我这样想)，我似乎找不到我的因子名了。如果我想查看每个州或每一年的剩余值(例如，按州/年计算的平均值)，那么如何使用resid()函数访问该值？谢谢!

回答已采纳

发布于 2014-02-01 10:49:59

正如在前面的评论中所说的，您必须认识到，正在返回的残差与您在数据集中的观察结果的顺序相同。

下面是一个使用每个R安装附带的虹膜数据集的示例(可能是非常荒谬的回归)：

data(iris)
m5 <- lm(Sepal.Length ~ Species*Sepal.Width, data=iris)
resid.m5 <- resid(m5)

dta.complete <- data.frame(iris, r.m5=resid.m5)

在这里，残差与原始数据相结合。这也许有点不正统，但为什么不把事情放在一起呢？现在，您可以任意使用所有的经典子集。例如：

with(dta.complete, by(r.m5, Species, mean))

祝好运!

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/21496472

复制

相似问题

问为什么在提取残差时找不到我的因子名？EN