pscl软件包在R中用于拟合零充气泊松模型等模型.
我有一个关于每周食物消费的数据框架,它是零通胀的.我没有问题拟合零充气泊松(ZIP)模型,它成功地预测了我的数据中零计数的百分比。该数据包含约30%的零计数,仅超过4600次观测。
ZIP模式是:
zeroinfl(LightC.home~SEX+AGEDET+Inhabitants, data=FoodAnalysis)在LightC为每周消费计数(0-74)的情况下,SEX为被访者性别(因子为2级),AGEDET为应答年龄带(因子为12级,例如"5-9岁“),Inhabitants为家庭中的人数(整数,范围为1至8)。
ZIP模式摘要如下:
Call:
zeroinfl(formula = LightC.home ~ SEX + AGEDET + Inhabitants, data = FoodAnalysis)
Pearson residuals:
Min 1Q Median 3Q Max
-3.3479 -1.2781 -0.5170 0.6342 12.2912
Count model coefficients (poisson with log link):
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.133213 0.029229 72.983 < 2e-16 ***
SEXFemale -0.079156 0.010284 -7.697 1.39e-14 ***
AGEDET5-9 years -0.038153 0.032745 -1.165 0.243963
AGEDET10-14 years 0.014199 0.032411 0.438 0.661317
AGEDET15-17 years 0.253942 0.035419 7.170 7.52e-13 ***
AGEDET18-24 years 0.148395 0.029089 5.101 3.37e-07 ***
AGEDET25-34 years 0.158506 0.026291 6.029 1.65e-09 ***
AGEDET35-44 years 0.157821 0.026043 6.060 1.36e-09 ***
AGEDET45-54 years 0.307299 0.026153 11.750 < 2e-16 ***
AGEDET55-64 years 0.340590 0.026913 12.655 < 2e-16 ***
AGEDET65-74 years 0.361976 0.027260 13.278 < 2e-16 ***
AGEDET75-84 years 0.251614 0.039866 6.311 2.76e-10 ***
AGEDET85 years or more 0.606829 0.083345 7.281 3.32e-13 ***
Inhabitants 0.014697 0.004302 3.416 0.000635 ***
Zero-inflation model coefficients (binomial with logit link):
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.82861 0.17389 -4.765 1.89e-06 ***
SEXFemale -0.08333 0.07196 -1.158 0.246893
AGEDET5-9 years -0.27280 0.18082 -1.509 0.131390
AGEDET10-14 years -0.32820 0.18390 -1.785 0.074308 .
AGEDET15-17 years -0.06472 0.20589 -0.314 0.753276
AGEDET18-24 years -0.06973 0.16047 -0.435 0.663896
AGEDET25-34 years -0.27054 0.14791 -1.829 0.067385 .
AGEDET35-44 years -0.71412 0.15648 -4.564 5.03e-06 ***
AGEDET45-54 years -0.50510 0.15585 -3.241 0.001191 **
AGEDET55-64 years -0.65281 0.16541 -3.947 7.92e-05 ***
AGEDET65-74 years -1.09276 0.18313 -5.967 2.41e-09 ***
AGEDET75-84 years -1.28092 0.34508 -3.712 0.000206 ***
AGEDET85 years or more -12.75039 279.21031 -0.046 0.963577
Inhabitants 0.01733 0.02872 0.603 0.546296
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Number of iterations in BFGS optimization: 35
Log-likelihood: -2.136e+04 on 28 Df我在predprob包中使用了pscl命令来构造食物的食用概率向量。该方法构造了一个矩阵,每个观测值一行,每个观测值的消耗概率在0(最小)到74 (最大值)之间。这个矩阵中有165个唯一的行,这是由于零充气泊松模型中165个唯一的预测器组合造成的。
我如何为每种预测因子(如女性,25-34岁,4名居民)的75种概率建立基础?从数学的角度看,我不明白这75个概率之间的关系。
例如,预测器组合SEX=="Female"、AGEDET=="25-34 years"和Inhabitants == 4给出了数据中使用该预测器组合的每个人的这些概率(仅显示了75个中的前6个):
X0 X1 X2 X3 X4 X5
0.2473285 0.0004504804 0.002183136 0.007053337 0.01709108 0.03313101这些概率是如何估计的,考虑到最初的zeroinfl公式看起来只是简单地估计了预测器的消费平均值,而不是所有的75个概率?
发布于 2015-10-02 21:24:30
零膨胀泊松模型是零点质量和泊松分布的混合物.关于确切的公式,请参阅vignette("countreg", package = "pscl")的2.3节。
在您的模型中,有两个线性预测器:一个用于泊松分量的平均值(带有日志链接),另一个用于零通货膨胀概率(使用logit链接)。使用问题中所示的特定的回归向量,我们可以计算两个线性预测因子,然后应用相应的逆链接函数得到平均mu和零通货膨胀概率pr。
mu <- exp(2.133213 -0.079156 + 0.158506 + 0.014697 * 4)
mu
## [1] 9.692487
pr <- plogis(-0.82861 -0.08333 -0.27054 + 0.01733 * 4)
pr
## [1] 0.2472822然后我们可以把它们输入混合物密度(见方程7):
y <- 0:5
pr * I(y == 0) + (1-pr) * dpois(y, mu)
## [1] 0.2473287134 0.0004504784 0.0021831278 0.0070533124 0.0170910338
## [6] 0.0331309230https://stackoverflow.com/questions/32884873
复制相似问题