首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何改变零膨胀回归模型的na.action?

如何改变零膨胀回归模型的na.action?
EN

Stack Overflow用户
提问于 2013-05-04 16:34:52
回答 2查看 3.1K关注 0票数 1

我正在使用来自zeroinfl包的函数pscl运行一个零充气负二项式回归模型。

我需要将NA排除在模型之外,以便能够在分析的后面绘制因变量的残差。

因此,我想设置na.action="na.exclude"。对于非零膨胀的负二项回归模型(使用来自glm.nb包的glm ),我可以做到这一点。

代码语言:javascript
复制
fm_nbin <- glm.nb(DV ~ factor(IDV) + contr1
               +contr2 + contr3, data=df, 
               subset=(df$var<500), na.action="na.exclude")
fm_nbin.res = resid(fm_nbin) 
plot(fm_nbin.res~df$var)  

效果很好。然而,当我对零膨胀模型做同样的操作时,它不起作用:

代码语言:javascript
复制
zinfl <- zeroinfl(DV ~ factor(IDV) + contr1
               +contr2 + contr3 | factor(IDV) + contr1
               +contr2 + contr3, data=df, 
               subset=(df$var<500), na.action="na.exclude")
zinfl.res = resid(zinfl) 
plot(zinfl.res~df$var)

给出误差

代码语言:javascript
复制
Error in function (formula, data = NULL, subset = NULL, na.action = na.fail,  : 
  variable lengths differ (found for 'df$var')

还有什么其他命令可以用来将NA排除在回归之外吗?

编辑: This是我能找到的最接近的答案。它能在某种程度上适用于我的问题吗?另外,naresid能否在某种程度上得到应用?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-05-06 09:37:43

由于使用na.omit(df)na.action="na.exclude"的选项在zeroinfl回归模型中似乎都不起作用,我发现了另一种(间接)实现NA的方法被排除在回归中。

首先,由于我的原始数据集包含的变量远远超过了回归器和结果变量,所以我创建了一个新的数据集,其中只包含了我在回归模型中使用的变量;并且在var值上设置了一个条件,以便在回归中包含观察:

代码语言:javascript
复制
df1 <- subset(df, var<500, select=c("DV", "IDV", "contr1", "contr2", "contr3"))
df1 <- na.omit(df1)

然后,我使用新的dataset df1运行与上面相同的代码,该数据集非常完美地工作:

代码语言:javascript
复制
zinfl <- zeroinfl(DV ~ factor(IDV) + contr1
           +contr2 + contr3 | factor(IDV) + contr1
           +contr2 + contr3, data=df1)
zinfl.res = resid(zinfl) 
plot(zinfl.res~df1$DV)
票数 0
EN

Stack Overflow用户

发布于 2013-05-04 16:58:33

通过跟踪从zeroinflglm.fit的文档,可以发现:“‘工厂-新鲜’默认值是na.omit。”请注意,我没有将引号放在它周围,因为它应该是一个函数,但是函数会接受它作为一个名称,所以如果引用它并不重要。我承认,我并不真正知道na.omitna.exclude到底有什么不同(这与我所读到的残差有关),但肯定会首先使用默认设置,因为它通常能从回归函数中提供我想要的东西。所以试着把它放在一边:

代码语言:javascript
复制
zinfl <- zeroinfl(DV ~ factor(IDV) + contr1
           +contr2 + contr3 | factor(IDV) + contr1
           +contr2 + contr3, data=df, 
           subset=(df$var<500) )
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/16376544

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档