一、LongReadSum简介LongReadSum 是美国费城儿童医院Kai Wang教授团队(图1)开发的一款专门针对长读长测序数据设计的快速质控工具(如纳米孔测序、PacBio测序等)。 #创建conda环境$ conda create -n longreadsum python=3.9#激活longreadsum环境$ conda activate longreadsum#如果使用mamba 1_raw_fastq/Case_1.fastq -o 1_longreadsum/Case1$ longreadsum fq -i 1_raw_fastq/Case_2.fastq -o 0_longreadsum /Case2$ longreadsum fq -i 1_raw_fastq/Case_3.fastq -o 0_longreadsum/Case3$ longreadsum fq -i 1_raw_fastq /Control_1.fastq -o 0_longreadsum/Control_1$ longreadsum fq -i 1_raw_fastq/Control_2.fastq -o 0_longreadsum
常用的质控利器:新旧交替,各有所长 针对PacBio长读长数据的质控,有一些工具在过去和现在都发挥着重要作用: LongReadSum: 这是一款历史相对悠久的工具,但仍在持续更新。 LongReadSum能够提供关于reads数量、长度分布等关键统计信息,帮助用户快速了解数据概况。 LongQC: LongQC是另一款功能较为全面的长读长质控工具。
在拿到测序质量未知的数据时,大家可以使用 LongQC 或 LongReadSum 等软件对数据质量进行查看统计,使用 chopper 对序列进行过滤修剪。