首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >过滤床文件中的重叠项

过滤床文件中的重叠项
EN

Stack Overflow用户
提问于 2017-04-15 23:11:56
回答 1查看 1.5K关注 0票数 3

我有一张床文件,看起来是这样的:

代码语言:javascript
复制
1   183113  183114  chr1:183113-183240  0   +
1   187286  187287  chr1:187128-187287  0   -
1   187576  187587  chr1:187375-187577  0   -
1   187580  187590  chr1:187379-187577  0   -

我的目标是只提取那些条目不与任何其他行重叠的行。据文档报道,一段时间以来,我一直在尝试将床上工具合并。我想使用特定的标志来计算每个“合并”片段的组成项,然后只保留那些值为"1“的条目,但问题来了:我不知道如何保存关于串、分数(这应该始终是0)和名称(这可以从前3列重构)的信息。有人知道怎么把这些东西放在一起吗?

输出应该与输入(上面)完全一样,但只与这些不与任何其他行重叠的行相同。

代码语言:javascript
复制
1   183113  183114  chr1:183113-183240  0   +
1   187286  187287  chr1:187128-187287  0   -
EN

回答 1

Stack Overflow用户

发布于 2017-04-18 16:42:37

好吧,我算出来了:

1)计算原始输入中的重叠

代码语言:javascript
复制
bedtools merge -i IN.bed -c 1 -o count > counted

2)只过滤那些与任何内容不重叠的行。

代码语言:javascript
复制
awk '/\t1$/{print}' counted > filtered

3)将其与原始输入相交,只保留过滤后发现的原始行。

代码语言:javascript
复制
bedtools intersect -a IN.bed -b filtered -wa > OUT.bed
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43432149

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档