我只是想检查一下我所做的一切都是正确的!
我有几个地点的鸟类计数,分为两种栖息地-农田和湿地。我只是想看看哪个栖息地的数量更多。
我正在使用一个带有泊松函数的GLM (因为它们是计数数据):
> mod <- glm(count ~ habitat, family = "poisson")
> summary(mod)
Call:
glm(formula = count ~ habitat, family = poisson)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.5868 -0.4603 -0.2496 -0.2141 2.8464
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.2695 1.0000 -0.269 0.788
habitatWetland 1.7331 1.0954 1.582 0.114
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 37.802 on 91 degrees of freedom
Residual deviance: 34.373 on 90 degrees of freedom
AIC: 48.987
Number of Fisher Scoring iterations: 6到目前一切尚好?
我的理解是(使用默认对比) Intercept指的是栖息地:农田-因此农田站点的估计平均计数应该是exp(-0.2695)。湿地上的估计平均计数将为exp(1.7331)。
截距p值(0.788)给出了截距(即农田中的计数)明显大于零的概率(尽管我对此不是特别感兴趣)。湿地p值(0.114)给出了湿地中的计数与截距不同(即与农田中的计数不同)的概率。因此,在这种情况下,两种栖息地类型之间没有显着差异(在5%的水平上)。
这些都是正确的吗?还有什么是我应该考虑的或者做得不一样的吗?
发布于 2017-12-20 01:11:39
接近,但对于湿地,速率是exp(-0.2695 + 1.7331),并且您对p值的理解是关闭的。P值不是替代假设为真的概率;它是在无效假设为真的情况下看到数据至少与观察到的数据一样极端的概率(并且您将在类似的情况下收集更多数据)。
截取的p值很少有用。从另一个系数的p值(0.114),很明显,您没有证据表明湿地和农田之间存在差异。
https://stackoverflow.com/questions/47891566
复制相似问题