我有一个关于在R中估计回归模型的问题。我有以下数据(示例):
Year XY
2002 5
2003 2
2004 4
2005 8
2006 3
2007 5
2008 10
the regression model I want to estimate is:
XY = B0 + Y2005 + Y2006 + Y2007 + Y2008 + e 其中,Y2005、Y2006、Y2007和Y2008是2005年、2006年、2007年、2008年取值为1的年度指标变量,否则取值为0。
我需要做的是将2005、2006、2007和2008年的(XY)值与(2002-2004)期间的(XY)的平均值进行比较。
我希望你能帮我弄清楚这个问题,并提前感谢你的帮助。
发布于 2017-02-02 22:23:40
DF <- read.table(text = "Year XY
2002 5
2003 2
2004 4
2005 8
2006 3
2007 5
2008 10", header = TRUE)
DF$facYear <- DF$Year
DF$facYear[DF$facYear < 2005] <- "baseline"
DF$facYear <- factor(DF$facYear)
#make sure that baseline is used as intercept:
DF$facYear <- relevel(DF$facYear, "baseline")
fit <- lm(XY ~ facYear, data = DF)
summary(fit)
#Coefficients:
# Estimate Std. Error t value Pr(>|t|)
#(Intercept) 3.6667 0.8819 4.158 0.0533 .
#facYear2005 4.3333 1.7638 2.457 0.1333
#facYear2006 -0.6667 1.7638 -0.378 0.7418
#facYear2007 1.3333 1.7638 0.756 0.5286
#facYear2008 6.3333 1.7638 3.591 0.0696 .https://stackoverflow.com/questions/42004387
复制相似问题