文章/答案/技术大牛

发布

社区首页 >问答首页 >FISHER精确检验与GLM的P值差异

问FISHER精确检验与GLM的P值差异
EN

Stack Overflow用户

提问于 2019-12-13 23:03:25

回答 1查看 458关注 0票数 1

我有一个数据集plink.raw，我正在测试maker CN00020133 (有3级0、1、2)是否与phenotype5相关联。我想使用GLM或fisher提取测试来比较0 vs 1和2 vs1：

    table(plink.raw$phenotype5,plink.raw$CN00020133)
              1     0     2
        0  3559     0     7
        1 14806    54   123

使用GLM进行测试，我可以看到0和1的p值是0.912894。 plink.raw$CN00020133 <- factor(plink.raw$CN00020133，levels=c("1"，"0"，"2")) univariate=glm(phenotype5 ~ relevel(CN00020133，ref ="1")，族=二项式，data = plink.raw)汇总(单变量) 呼叫： glm(公式= phenotype5 ~ relevel(CN00020133，ref = "1")，族=二项式，数据= plink.raw) 偏差残差：最小1Q中位数3Q最大值-2.4173 0.6564 0.6564 0.6564系数：估计性病错误z值Pr(> Signif =“1”)(CN00020133，ref = "1")0 13.14051 120.12616 0.109 0.912894 relevel(CN00020133，ref = "1")2 1.44072 0.38902 3.703 0.000213 *--符号。编码:0 '*‘0.001’*‘0.01’*‘0.05 '.’0.1‘’1(二项式族的色散参数被认为是1)零偏差: 18158在18548自由度上，剩余偏差: 18114在18546自由度上: 18120次Fisher评分迭代: 13次
但是如果我用fisher精确检验来测试它，0vs-1的p值是4.618e-06。定罪<-矩阵(c(0，54,3559,14806)，nrow = 2，dimnames =列表(c(“控制”，"case")，c("del/dup"，“normal_copy”))fisher.test(定罪，替代=“较少”)费希尔对计数数据的精确测试:定罪p-值= 9.048e-06替代假设:真实优势比小于1.95%置信区间: 0.0000000 0.2374411样本估计:优势比0

glm

p-value

回答 1

Stack Overflow用户

发布于 2019-12-15 18:51:59

你有一个完全分离的例子，也被称为哈克-唐纳效应发生。如果您CN00020133==0，它们都有1作为表型，这使得很难估计的标准误差的系数。上面有相当多的资料，比如Alexej的博客，布赖恩·里普利( Brian Ripley )，本·博尔克笔记。

如果您需要检验"1“效应的显着性，一个解决方案是使用似然比检验：

df =  rbind(
data.frame(phenotype=rep(0:1,c(3559,14806)),CN00020133="1"),
data.frame(phenotype=rep(0:1,c(0,54)),CN00020133="0")
)

anova(glm(phenotype ~ CN00020133,data=df,family=binomial),test="Chisq")

Analysis of Deviance Table

Model: binomial, link: logit

Response: phenotype

Terms added sequentially (first to last)


           Df Deviance Resid. Df Resid. Dev Pr(>Chi)    
NULL                       18418      18082             
CN00020133  1   23.227     18417      18059 1.44e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

与fisher测试相比，这给出了不同的p值，因为它是不同的分布(二项分布与超几何分布)。但是，或多或少您可以得出结论，使用"0“作为参考，有一个附加的"1”效应。

费思的逻辑回归在R中有一个实现，你可以试着去看，但我必须说我对此不太熟悉：

library("logistf")
logistf(phenotype ~ CN00020133,data=df,family=binomial)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/59330843

复制

相似问题

问FISHER精确检验与GLM的P值差异
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问FISHER精确检验与GLM的P值差异EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问FISHER精确检验与GLM的P值差异
EN