我有两个文件(健康vs癌症)包含转座元素类和子类(两列),但一个有71602行,另一个有72500行,我试图将它们作为一个数据框放在一个文件中进行费舍尔测试,看看是否有一个类在癌症中比健康组织中更重要,但没有成功。有人知道如何获取一个文件并执行fisher测试吗?
发布于 2015-03-18 23:40:12
Fisher检验的输入是2x2列联表。您想要的是分别从您的两个文件中读取,然后从它们生成一个列联表。您不需要将两个文件合并到一个数据框中。例如,您可以这样做
df1<-data.frame(health=rep("healthy", 5), TE=sample(c("A", "B"), 5, replace=T))
df2<-data.frame(health=rep("cancer", 7), TE=sample(c("A", "B"), 7, replace=T))
ctable<-matrix(c(sum(df1$TE=='A'), sum(df1$TE=='B'), sum(df2$TE=='A'), sum(df2$TE=='B')), nrow=2, ncol=2, dimnames=list(c("A", "B"), c("Healthy", "Cancer")))
ctable
fisher.test(ctable)https://stackoverflow.com/questions/29125985
复制相似问题