首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >fastq文件读取的比较

fastq文件读取的比较
EN

Stack Overflow用户
提问于 2022-10-17 06:40:15
回答 1查看 46关注 0票数 0

我的目标是比较读取从两个不同的fastq文件。作为参考,这是fastq文件所包含的内容:

@SRR1174213.1 HWI-1116:69:D0JBGACXX:2:1101:1388:2317 length=100 length=100 +SRR1174213.1 HWI-1116:69:D0JBGACXX:2:1101:1388:2317 length=100 8;?DDDDDFFF>2AFFFFBFGEE@AHHIFFG@FFFECECFEIIIB09???DDFF3=@;3>A

fastq的分类如下:

*这一行包含读取ID

@SRR1174213.1 HWI-1116:69:D0JBGACXX:2:1101:1388:2317 length=100

*这一行包含序列

*再读ID +SRR1174213.1 HWI-1116:69:D0JBGACXX:2:1101:1388:2317 length=100

*这一行包含了序列中每个碱基的质量分数。

8;?DDDDDFFF>2AFFFFBFGEE@AHHIFFG@FFFECECFEIIIB09??DDFF3=@;3>A

以下是要执行的比较:

  1. 两个fastq文件之间有多少个常见的读取?
  2. ,一个fastq文件中有多少个不存在于另一个文件中?也就是说,读取每个文件都是唯一的。
  3. 在两个文件中的序列在哪里以及如何不同?序列的末端(3‘端)、序列的开头(5’端)的核苷酸碱基有差异吗?还是在序列中间的某个地方?序列的长度有差别吗?如果是的话,长度和区别是什么?我想得到的原始序列加上他们之间的差异,为analysis.
  4. Does质量分数不同?序列的质量有何不同?
EN

回答 1

Stack Overflow用户

发布于 2022-10-17 09:50:42

没有蟒蛇,你想要comm https://linux.die.net/man/1/comm

两个fastq文件之间有多少常见的读取?

代码语言:javascript
复制
comm -12 <(gunzip -c in1.fq.gz |paste - - - - | cut -f 2 | sort | uniq ) <(gunzip -c in2.fq.gz |paste - - - - | cut -f 2 | sort | uniq)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/74093389

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档