我把一些数据拟合成泊松分布,数据如下:
observed <- c(290, 630, 873, 853, 618, 310, 138, 54, 21, 9, 4)
estimated_prob_mass <- c(0.064, 0.176, 0.242, 0.222, 0.152, 0.084, 0.038, 0.015, 0.005, 0.002, 0.000)从视觉上看,缩放的分布非常适合数据。我使用ChiSq拟合优度测试来检查数据并得到以下结果:
chisq.test(observed, p=estimated_prob_mass)
#Warning message in chisq.test(observed, p = estimated_prob_mass):
#"Chi-squared approximation may be incorrect"
#Chi-squared test for given probabilities
#data: observed
#X-squared = Inf, df = 10, p-value < 2.2e-16为什么在这种情况下,我会得到一个无限的ChiSq值和一个接近于零的p值?
发布于 2021-08-12 20:06:38
您为其中一个单元提供了估计为0的概率。如果你得到那个单元格的非零值,那么测试就会被拒绝,因为你的概率得到了一个不可能的结果。更改概率向量,使最后一个概率为.001,然后对其余的向量进行规范化,将得到一个更合理的结果。
> observed <- c(290, 630, 873, 853, 618, 310, 138, 54, 21, 9, 4)
> estimated_prob_mass <- c(0.064, 0.176, 0.242, 0.222, 0.152, 0.084, 0.038, 0.015, 0.005, 0.002, 0.000)
> e <- estimated_prob_mass
> e[11] <- .001
> e <- e/sum(e)
>
> # Let's compare the probabilities provided versus the new ones
> estimated_prob_mass
[1] 0.064 0.176 0.242 0.222 0.152 0.084 0.038 0.015 0.005 0.002 0.000
> round(e, 3)
[1] 0.064 0.176 0.242 0.222 0.152 0.084 0.038 0.015 0.005 0.002 0.001
>
> chisq.test(observed, p = e)
Chi-squared test for given probabilities
data: observed
X-squared = 17.748, df = 10, p-value = 0.05936
Warning message:
In chisq.test(observed, p = e) : Chi-squared approximation may be incorrect最主要的是,你的概率向量要么是完全准确的,在这种情况下,你绝对100%应该拒绝零-或者它实际上没有意义。如果你认为这应该是有意义的,并且不了解你得到的结果,那么你应该重新考虑你的测试,并咨询统计学家。对概率向量做如此轻微的尝试,可以使结果在拒绝零而不受惩罚之间发生变化,而不是一丝一毫地拒绝。所以如果这不合理的话,我建议你去咨询统计学家。
https://stackoverflow.com/questions/68763505
复制相似问题