首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用bowtie2为循环(for循环)应用文件限制

使用bowtie2为循环(for循环)应用文件限制
EN

Stack Overflow用户
提问于 2020-11-02 01:36:54
回答 1查看 172关注 0票数 1

你好,我只想对一组文件应用一个循环,但不是对我的所有文件执行循环,而是只对目录中的某些文件执行循环。

下面是我使用的命令,是基于bowtie2的基因组序列比对:

代码语言:javascript
复制
 for i in *1.fastq.gz
    do 
    base=$(basename $i "_1.fastq.gz")
    bowtie2 -p 8 -x /mnt/path/contigs -1 ${base}_1.fastq.gz -2 ${base}_2.fastq.gz | samtools view -b -o ${base}.bam -
    done

因此,使用这个命令,bowtie2与我的所有文件对齐,但是考虑到在这个文件夹中有一些文件的bowtie2分析已经完成,我不希望bowtie2再次对这些文件进行分析,所以,我可以在这个循环中添加任何子命令来避免对某些文件进行分析吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-11-06 21:53:31

创建2个文件,每个文件每行有一个basename:(1)输入,此处读取1个fastq基本文件名,(2)现有输出,此处读取基本文件名。对文件进行排序,并使用comm -23 file1 file2 > file3只选择尚未映射的基名。然后循环这些,保存在file3中。

快速和脏的解决方案(假设文件名没有空格):

代码语言:javascript
复制
ls -1 *_1.fastq.gz | perl -pe 's/_1.fastq.gz//' | sort > in.basenames.txt
ls -1 *.bam | perl -pe 's/.bam//' | sort > out.basenames.txt
comm -23 in.basenames.txt out.basenames.txt > todo.in.basenames.txt

while read -r base_name ; do
    bowtie2 -1 ${base_name}_1.fastq.gz -2 ${base_name}_2.fastq.gz ...
done < todo.in.basenames.txt
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64638763

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档