我有一张床文件,看起来是这样的:
1 183113 183114 chr1:183113-183240 0 +
1 187286 187287 chr1:187128-187287 0 -
1 187576 187587 chr1:187375-187577 0 -
1 187580 187590 chr1:187379-187577 0 -我的目标是只提取那些条目不与任何其他行重叠的行。据文档报道,一段时间以来,我一直在尝试将床上工具合并。我想使用特定的标志来计算每个“合并”片段的组成项,然后只保留那些值为"1“的条目,但问题来了:我不知道如何保存关于串、分数(这应该始终是0)和名称(这可以从前3列重构)的信息。有人知道怎么把这些东西放在一起吗?
输出应该与输入(上面)完全一样,但只与这些不与任何其他行重叠的行相同。
1 183113 183114 chr1:183113-183240 0 +
1 187286 187287 chr1:187128-187287 0 -发布于 2017-04-18 16:42:37
好吧,我算出来了:
1)计算原始输入中的重叠
bedtools merge -i IN.bed -c 1 -o count > counted2)只过滤那些与任何内容不重叠的行。
awk '/\t1$/{print}' counted > filtered3)将其与原始输入相交,只保留过滤后发现的原始行。
bedtools intersect -a IN.bed -b filtered -wa > OUT.bedhttps://stackoverflow.com/questions/43432149
复制相似问题