我有一个文件夹,其中有许多文件,需要组合,我正在寻找一个很好的命令来做它。这些文件如下所示:
Concatenate Together:
A1_S1_L001_R1_001.fastq.gz
A1_S1_L002_R1_001.fastq.gz
A1_S1_L003_R1_001.fastq.gz
A1_S1_L004_R1_001.fastq.gz
Concatenate Together:
A1_S1_L001_R2_001.fastq.gz
A1_S1_L002_R2_001.fastq.gz
A1_S1_L003_R2_001.fastq.gz
A1_S1_L004_R2_001.fastq.gz
Concatenate Together:
B1_S1_L001_R1_001.fastq.gz
B1_S1_L002_R1_001.fastq.gz
B1_S1_L003_R1_001.fastq.gz
B1_S1_L004_R1_001.fastq.gz
Concatenate Together:
B1_S1_L001_R2_001.fastq.gz
B1_S1_L002_R2_001.fastq.gz
B1_S1_L003_R2_001.fastq.gz
B1_S1_L004_R2_001.fastq.gz
etc.因此,对于数百个文件,第一个字母和数字(此处为A1或B1 )指的是包含两个子组(R1和R2)的组。主要基团为A1-H1、A2-H2和A3-H3。在每个子组中有四个文件(L001、L002、L003、L004)。
有什么好的方法可以简单地将这些与zcat (或其他任何方式)结合起来吗?
发布于 2016-09-20 21:00:12
像这样的事情应该可以做到:
cd "/path/to/the/directory" || exit 1
for num in {1..3}; do
for letter in {A..H}; do
for subgroup in R1 R2; do
zcat "$letter$num"_S1_L*_"$subgroup"_001.fastq.gz > "$letter$num-$subgroup"
done
done
done您可能必须调整输出文件的名称(可能还有路径)。我使用了"$letter$num-$subgroup",例如B1-R1。
https://stackoverflow.com/questions/39603536
复制相似问题