首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >linux在picard中合并多个文件

linux在picard中合并多个文件
EN

Stack Overflow用户
提问于 2017-12-22 11:07:54
回答 1查看 414关注 0票数 0

我有十个目录,每个目录大约有10-12个bam文件。我需要使用picard包将它们合并在一起,我想找到一种方法来做得更好。

代码语言:javascript
复制
basic command:
java -jar picard.jar MergeSamFiles \
  I=input_1.bam \
  I=input_2.bam \
  O=merged_files.bam

directory 1:
java -jar picard.jar MergeSamFiles \
  I=input_16.bam \
  I=input_28.bam \
  I=input_81.bam \
  I=input_34.bam \
  ... \
  ... \
  I=input_10.bam \
  O=merged_files.bam

directory 2:
java -jar picard.jar MergeSamFiles \
  I=input_44.bam \
  I=input_65.bam \
  I=input_181.bam \
  I=input_384.bam \
  ... \
  ... \
  I=input_150.bam \
  O=merged_files.bam

如果它们不是连续的,我如何使用变量添加输入,并且我想对这十个目录执行for循环,但它们包含不同数量的bam文件。

我应该使用python还是R来做这件事,还是继续使用shell脚本?敬请指教。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-12-22 11:20:03

为什么不使用samtools呢?

代码语言:javascript
复制
for folder in my_bam_folders/*; do
    samtools merge $folder.bam $folder/*.bam
done

通常,samtools merge可以合并给定目录中的所有bam文件,如下所示:

代码语言:javascript
复制
samtools merge merged.bam *.bam

编辑:如果samtools不是一个选项,而你必须使用Picard,那么像这样的东西呢?

代码语言:javascript
复制
for folder in my_bam_folders/*; do
    bamlist=$(for f in $folder/*.bam; do echo -n "I=$f " ; done)
    java -jar picard.jar MergeSamFiles $bamlist O=$folder.bam
done
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47935375

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档