首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >pscl中使用predprob的公式或基本计数预测

pscl中使用predprob的公式或基本计数预测
EN

Stack Overflow用户
提问于 2015-10-01 10:09:34
回答 1查看 207关注 0票数 0

pscl软件包在R中用于拟合零充气泊松模型等模型.

我有一个关于每周食物消费的数据框架,它是零通胀的.我没有问题拟合零充气泊松(ZIP)模型,它成功地预测了我的数据中零计数的百分比。该数据包含约30%的零计数,仅超过4600次观测。

ZIP模式是:

代码语言:javascript
复制
 zeroinfl(LightC.home~SEX+AGEDET+Inhabitants, data=FoodAnalysis)

LightC为每周消费计数(0-74)的情况下,SEX为被访者性别(因子为2级),AGEDET为应答年龄带(因子为12级,例如"5-9岁“),Inhabitants为家庭中的人数(整数,范围为1至8)。

ZIP模式摘要如下:

代码语言:javascript
复制
Call:
zeroinfl(formula = LightC.home ~ SEX + AGEDET + Inhabitants, data = FoodAnalysis)

Pearson residuals:
    Min      1Q  Median      3Q     Max 
-3.3479 -1.2781 -0.5170  0.6342 12.2912 

Count model coefficients (poisson with log link):
                        Estimate Std. Error z value Pr(>|z|)    
(Intercept)             2.133213   0.029229  72.983  < 2e-16 ***
SEXFemale              -0.079156   0.010284  -7.697 1.39e-14 ***
AGEDET5-9 years        -0.038153   0.032745  -1.165 0.243963    
AGEDET10-14 years       0.014199   0.032411   0.438 0.661317    
AGEDET15-17 years       0.253942   0.035419   7.170 7.52e-13 ***
AGEDET18-24 years       0.148395   0.029089   5.101 3.37e-07 ***
AGEDET25-34 years       0.158506   0.026291   6.029 1.65e-09 ***
AGEDET35-44 years       0.157821   0.026043   6.060 1.36e-09 ***
AGEDET45-54 years       0.307299   0.026153  11.750  < 2e-16 ***
AGEDET55-64 years       0.340590   0.026913  12.655  < 2e-16 ***
AGEDET65-74 years       0.361976   0.027260  13.278  < 2e-16 ***
AGEDET75-84 years       0.251614   0.039866   6.311 2.76e-10 ***
AGEDET85 years or more  0.606829   0.083345   7.281 3.32e-13 ***
Inhabitants             0.014697   0.004302   3.416 0.000635 ***

Zero-inflation model coefficients (binomial with logit link):
                        Estimate Std. Error z value Pr(>|z|)    
(Intercept)             -0.82861    0.17389  -4.765 1.89e-06 ***
SEXFemale               -0.08333    0.07196  -1.158 0.246893    
AGEDET5-9 years         -0.27280    0.18082  -1.509 0.131390    
AGEDET10-14 years       -0.32820    0.18390  -1.785 0.074308 .  
AGEDET15-17 years       -0.06472    0.20589  -0.314 0.753276    
AGEDET18-24 years       -0.06973    0.16047  -0.435 0.663896    
AGEDET25-34 years       -0.27054    0.14791  -1.829 0.067385 .  
AGEDET35-44 years       -0.71412    0.15648  -4.564 5.03e-06 ***
AGEDET45-54 years       -0.50510    0.15585  -3.241 0.001191 ** 
AGEDET55-64 years       -0.65281    0.16541  -3.947 7.92e-05 ***
AGEDET65-74 years       -1.09276    0.18313  -5.967 2.41e-09 ***
AGEDET75-84 years       -1.28092    0.34508  -3.712 0.000206 ***
AGEDET85 years or more -12.75039  279.21031  -0.046 0.963577    
Inhabitants              0.01733    0.02872   0.603 0.546296    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Number of iterations in BFGS optimization: 35 
Log-likelihood: -2.136e+04 on 28 Df

我在predprob包中使用了pscl命令来构造食物的食用概率向量。该方法构造了一个矩阵,每个观测值一行,每个观测值的消耗概率在0(最小)到74 (最大值)之间。这个矩阵中有165个唯一的行,这是由于零充气泊松模型中165个唯一的预测器组合造成的。

我如何为每种预测因子(如女性,25-34岁,4名居民)的75种概率建立基础?从数学的角度看,我不明白这75个概率之间的关系。

例如,预测器组合SEX=="Female"AGEDET=="25-34 years"Inhabitants == 4给出了数据中使用该预测器组合的每个人的这些概率(仅显示了75个中的前6个):

代码语言:javascript
复制
        X0            X1           X2           X3          X4          X5
 0.2473285  0.0004504804  0.002183136  0.007053337  0.01709108  0.03313101

这些概率是如何估计的,考虑到最初的zeroinfl公式看起来只是简单地估计了预测器的消费平均值,而不是所有的75个概率?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-10-02 21:24:30

零膨胀泊松模型是零点质量和泊松分布的混合物.关于确切的公式,请参阅vignette("countreg", package = "pscl")的2.3节。

在您的模型中,有两个线性预测器:一个用于泊松分量的平均值(带有日志链接),另一个用于零通货膨胀概率(使用logit链接)。使用问题中所示的特定的回归向量,我们可以计算两个线性预测因子,然后应用相应的逆链接函数得到平均mu和零通货膨胀概率pr

代码语言:javascript
复制
mu <- exp(2.133213 -0.079156 + 0.158506 + 0.014697 * 4)
mu
## [1] 9.692487
pr <- plogis(-0.82861 -0.08333 -0.27054 + 0.01733 * 4)
pr
## [1] 0.2472822

然后我们可以把它们输入混合物密度(见方程7):

代码语言:javascript
复制
y <- 0:5
pr * I(y == 0) + (1-pr) * dpois(y, mu)
## [1] 0.2473287134 0.0004504784 0.0021831278 0.0070533124 0.0170910338
## [6] 0.0331309230
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32884873

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档