首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >FISHER精确检验与GLM的P值差异

FISHER精确检验与GLM的P值差异
EN

Stack Overflow用户
提问于 2019-12-13 23:03:25
回答 1查看 458关注 0票数 1

我有一个数据集plink.raw,我正在测试maker CN00020133 (有3级0、1、2)是否与phenotype5相关联。我想使用GLM或fisher提取测试来比较0 vs 1和2 vs1:

代码语言:javascript
复制
    table(plink.raw$phenotype5,plink.raw$CN00020133)
              1     0     2
        0  3559     0     7
        1 14806    54   123
  1. 使用GLM进行测试,我可以看到0和1的p值是0.912894。 plink.raw$CN00020133 <- factor(plink.raw$CN00020133,levels=c("1","0","2")) univariate=glm(phenotype5 ~ relevel(CN00020133,ref ="1"),族=二项式,data = plink.raw)汇总(单变量) 呼叫: glm(公式= phenotype5 ~ relevel(CN00020133,ref = "1"),族=二项式,数据= plink.raw) 偏差残差: 最小1Q中位数3Q最大值-2.4173 0.6564 0.6564 0.6564系数: 估计性病错误z值Pr(> Signif =“1”)(CN00020133,ref = "1")0 13.14051 120.12616 0.109 0.912894 relevel(CN00020133,ref = "1")2 1.44072 0.38902 3.703 0.000213 *--符号。编码:0 '*‘0.001’*‘0.01’*‘0.05 '.’0.1‘’1(二项式族的色散参数被认为是1)零偏差: 18158在18548自由度上,剩余偏差: 18114在18546自由度上: 18120次Fisher评分迭代: 13次
  2. 但是如果我用fisher精确检验来测试它,0vs-1的p值是4.618e-06。 定罪<-矩阵(c(0,54,3559,14806),nrow = 2,dimnames =列表(c(“控制”,"case"),c("del/dup",“normal_copy”))fisher.test(定罪,替代=“较少”)费希尔对计数数据的精确测试:定罪p-值= 9.048e-06替代假设:真实优势比小于1.95%置信区间: 0.0000000 0.2374411样本估计:优势比0
EN

回答 1

Stack Overflow用户

发布于 2019-12-15 18:51:59

你有一个完全分离的例子,也被称为哈克-唐纳效应发生。如果您CN00020133==0,它们都有1作为表型,这使得很难估计的标准误差的系数。上面有相当多的资料,比如Alexej的博客布赖恩·里普利( Brian Ripley )本·博尔克笔记

如果您需要检验"1“效应的显着性,一个解决方案是使用似然比检验:

代码语言:javascript
复制
df =  rbind(
data.frame(phenotype=rep(0:1,c(3559,14806)),CN00020133="1"),
data.frame(phenotype=rep(0:1,c(0,54)),CN00020133="0")
)

anova(glm(phenotype ~ CN00020133,data=df,family=binomial),test="Chisq")

Analysis of Deviance Table

Model: binomial, link: logit

Response: phenotype

Terms added sequentially (first to last)


           Df Deviance Resid. Df Resid. Dev Pr(>Chi)    
NULL                       18418      18082             
CN00020133  1   23.227     18417      18059 1.44e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

与fisher测试相比,这给出了不同的p值,因为它是不同的分布(二项分布与超几何分布)。但是,或多或少您可以得出结论,使用"0“作为参考,有一个附加的"1”效应。

费思的逻辑回归在R中有一个实现,你可以试着去看,但我必须说我对此不太熟悉:

代码语言:javascript
复制
library("logistf")
logistf(phenotype ~ CN00020133,data=df,family=binomial)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59330843

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档