我想要比较并获得三个不同数据集中的重叠区域。比较也应该以中央通讯社为基础。
data1
chr start end CNA
1 170900001 171500001 loss
1 11840001 19420001 loss
1 60300001 62700001 gain
1 25520001 25820001 gain
data2
chr start end CNA
1 170940001 171500001 gain
1 60300001 62700001 gain
1 25520001 25840001 gain
1 119860001 123040001 loss
1 171500001 171580001 gain
1 79240001 84420001 gain
data 3
chr start end CNA
1 170950001 171500001 gain
1 60300001 62700001 loss
1 25530001 25840001 gain预期输出
chr start end CNA
1 170950001 171500001 gain
1 25530001 25840001 gain我使用GenomicRanges进行比较。首先,我尝试根据“得”和“失”对基因组区域进行排序。然后,我在每组之间分别使用findOverlaps进行例如。df1 <- findOverlaps(data1,data2),然后是findOverlaps(df1,data3)。我知道bed工具是有选择的,但我很想知道是否有任何替代方法可以使用GenomicRanges获得所需的输出?
发布于 2015-04-16 04:46:01
我做了ask a similar question several days ago。你没有提到GenomicRanges是否为你工作。我发现库IRange对我来说确实工作得更好。也许我的方法对你有用
https://stackoverflow.com/questions/29658052
复制相似问题