我正在使用来自zeroinfl包的函数pscl运行一个零充气负二项式回归模型。
我需要将NA排除在模型之外,以便能够在分析的后面绘制因变量的残差。
因此,我想设置na.action="na.exclude"。对于非零膨胀的负二项回归模型(使用来自glm.nb包的glm ),我可以做到这一点。
fm_nbin <- glm.nb(DV ~ factor(IDV) + contr1
+contr2 + contr3, data=df,
subset=(df$var<500), na.action="na.exclude")
fm_nbin.res = resid(fm_nbin)
plot(fm_nbin.res~df$var) 效果很好。然而,当我对零膨胀模型做同样的操作时,它不起作用:
zinfl <- zeroinfl(DV ~ factor(IDV) + contr1
+contr2 + contr3 | factor(IDV) + contr1
+contr2 + contr3, data=df,
subset=(df$var<500), na.action="na.exclude")
zinfl.res = resid(zinfl)
plot(zinfl.res~df$var)给出误差
Error in function (formula, data = NULL, subset = NULL, na.action = na.fail, :
variable lengths differ (found for 'df$var')还有什么其他命令可以用来将NA排除在回归之外吗?
编辑: This是我能找到的最接近的答案。它能在某种程度上适用于我的问题吗?另外,naresid能否在某种程度上得到应用?
发布于 2013-05-06 09:37:43
由于使用na.omit(df)或na.action="na.exclude"的选项在zeroinfl回归模型中似乎都不起作用,我发现了另一种(间接)实现NA的方法被排除在回归中。
首先,由于我的原始数据集包含的变量远远超过了回归器和结果变量,所以我创建了一个新的数据集,其中只包含了我在回归模型中使用的变量;并且在var值上设置了一个条件,以便在回归中包含观察:
df1 <- subset(df, var<500, select=c("DV", "IDV", "contr1", "contr2", "contr3"))
df1 <- na.omit(df1)然后,我使用新的dataset df1运行与上面相同的代码,该数据集非常完美地工作:
zinfl <- zeroinfl(DV ~ factor(IDV) + contr1
+contr2 + contr3 | factor(IDV) + contr1
+contr2 + contr3, data=df1)
zinfl.res = resid(zinfl)
plot(zinfl.res~df1$DV)发布于 2013-05-04 16:58:33
通过跟踪从zeroinfl到glm.fit的文档,可以发现:“‘工厂-新鲜’默认值是na.omit。”请注意,我没有将引号放在它周围,因为它应该是一个函数,但是函数会接受它作为一个名称,所以如果引用它并不重要。我承认,我并不真正知道na.omit和na.exclude到底有什么不同(这与我所读到的残差有关),但肯定会首先使用默认设置,因为它通常能从回归函数中提供我想要的东西。所以试着把它放在一边:
zinfl <- zeroinfl(DV ~ factor(IDV) + contr1
+contr2 + contr3 | factor(IDV) + contr1
+contr2 + contr3, data=df,
subset=(df$var<500) )https://stackoverflow.com/questions/16376544
复制相似问题