首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在列表之间找到基因重叠的百分比

在列表之间找到基因重叠的百分比
EN

Stack Overflow用户
提问于 2019-09-04 13:29:22
回答 2查看 164关注 0票数 0

这个问题是here发现的问题的变体。

我也想评估基因重叠的百分比,但我不想在一个列表中对所有基因进行成对的比较,我想比较一个列表和一个不同的列表集。最初的帖子回答给出了一个优雅的嵌套sapply,我认为这在我的情况下是行不通的。

以下是一些示例数据。

代码语言:javascript
复制
>listOfGenes1 <- list("cellLine1" = c("ENSG001", "ENSG002", "ENSG003"), "cellLine2" = c("ENSG003", "ENSG004"), "cellLine3" = c("ENSG004", "ENSG005"))
>myCellLine <- list("myCellLine" = c("ENSG001", "ENSG002", "ENSG003"))

我希望将listOfGenes1中的每个细胞系与myCellLine中的单个组进行比较,输出如下:

代码语言:javascript
复制
>overlaps
cellLine1   cellLine2   cellLine3
      100          33           0

为了清楚起见,我想要百分比重叠,以"myCellLine“作为分母。到目前为止,我一直在做的事情并没有奏效。

代码语言:javascript
复制
overlaps <- sapply(listOfGenes1, function(g1) {round(length(intersect(g1, myCellLine)) / length(myCellLine) * 100)})
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-09-04 13:34:07

你可以试试,

代码语言:javascript
复制
round(sapply(listOfGenes1, function(i)
                100 * length(intersect(i, myCellLine[[1]])) / length(myCellLine[[1]])), 0)

#cellLine1 cellLine2 cellLine3 
#      100        33         0 

注意:您的myCellLine对象是一个列表,因此length(myCellLine)不能工作

票数 2
EN

Stack Overflow用户

发布于 2019-09-04 13:36:02

我们可以使用sapply

代码语言:javascript
复制
sapply(listOfGenes1, function(x) mean(myCellLine[[1]] %in% x) * 100)

#cellLine1 cellLine2 cellLine3 
#100.00000  33.33333   0.00000 
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57789480

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档