我的目标是比较读取从两个不同的fastq文件。作为参考,这是fastq文件所包含的内容:
@SRR1174213.1 HWI-1116:69:D0JBGACXX:2:1101:1388:2317 length=100 length=100 +SRR1174213.1 HWI-1116:69:D0JBGACXX:2:1101:1388:2317 length=100 8;?DDDDDFFF>2AFFFFBFGEE@AHHIFFG@FFFECECFEIIIB09???DDFF3=@;3>A
fastq的分类如下:
*这一行包含读取ID
@SRR1174213.1 HWI-1116:69:D0JBGACXX:2:1101:1388:2317 length=100
*这一行包含序列
*再读ID +SRR1174213.1 HWI-1116:69:D0JBGACXX:2:1101:1388:2317 length=100
*这一行包含了序列中每个碱基的质量分数。
8;?DDDDDFFF>2AFFFFBFGEE@AHHIFFG@FFFECECFEIIIB09??DDFF3=@;3>A
以下是要执行的比较:
发布于 2022-10-17 09:50:42
没有蟒蛇,你想要comm https://linux.die.net/man/1/comm
两个fastq文件之间有多少常见的读取?
comm -12 <(gunzip -c in1.fq.gz |paste - - - - | cut -f 2 | sort | uniq ) <(gunzip -c in2.fq.gz |paste - - - - | cut -f 2 | sort | uniq)https://stackoverflow.com/questions/74093389
复制相似问题