首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在两个以上的数据集中查找重叠的基因组坐标

在两个以上的数据集中查找重叠的基因组坐标
EN

Stack Overflow用户
提问于 2015-04-16 02:31:48
回答 1查看 592关注 0票数 0

我想要比较并获得三个不同数据集中的重叠区域。比较也应该以中央通讯社为基础。

代码语言:javascript
复制
 data1
      chr start         end       CNA
        1   170900001   171500001   loss
        1   11840001    19420001    loss
        1   60300001    62700001    gain
        1   25520001    25820001    gain

data2
    chr  start       end        CNA
    1   170940001   171500001   gain
    1   60300001    62700001    gain
    1   25520001    25840001    gain
    1   119860001   123040001   loss
    1   171500001   171580001   gain
    1   79240001    84420001    gain


data 3
chr  start       end        CNA
1   170950001   171500001   gain
1   60300001    62700001    loss
1   25530001    25840001    gain

预期输出

代码语言:javascript
复制
   chr  start       end        CNA
    1   170950001   171500001   gain
    1   25530001    25840001    gain

我使用GenomicRanges进行比较。首先,我尝试根据“得”和“失”对基因组区域进行排序。然后,我在每组之间分别使用findOverlaps进行例如。df1 <- findOverlaps(data1,data2),然后是findOverlaps(df1,data3)。我知道bed工具是有选择的,但我很想知道是否有任何替代方法可以使用GenomicRanges获得所需的输出?

EN

回答 1

Stack Overflow用户

发布于 2015-04-16 04:46:01

我做了ask a similar question several days ago。你没有提到GenomicRanges是否为你工作。我发现库IRange对我来说确实工作得更好。也许我的方法对你有用

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29658052

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档