原始下机数据质量统计 -- NanoComp关于ONT下机数据的质量统计和可视化,可参考前面的详细教程:三代测序 - Oxford Nanopore (ONT) 数据分析 - 数据质控和过滤。 这里直接使用NanoComp一步到位:使用软件NanoComp:https://github.com/wdecoster/nanocomp软件安装$ pip install NanoComp软件使用#官方使用示例 $ NanoComp --bam alignment1.bam alignment2.bam alignment3.bam --outdir compare-runs$ NanoComp --fastq reads1.fastq.gz reads2.fastq.gz reads3.fastq.gz reads4.fastq.gz --names run1 run2 run3 run4#实际样本$ nohup NanoComp -fastq 0_raw_fq/ERR3218373.fastq.gz 0_raw_fq/ERR3218377.fastq.gz \--names ERR3218373 ERR3218377 \-o NanoComp
NanoComp 包含了 NanoStat,NanoPlot 和 NanoQC 的内容,而且多样本之间的比较和整合性比较好,所以 多样本 可以直接使用 NanoComp ,单个样本可以运行 Nanoplot NanoComp: comparing multiple runs 比较多组长度长测序和比对数据。 以上所有软件都存放在Nanopack的github里面,可以通过一行安装命令进行安装: #一键安装ONT系列质控软件 $ pip install nanopack # NanoComp 软件安装 #pip安装 $ pip install NanoComp #This script is written for Python3. 软件使用 #官方示例 $ NanoComp --bam alignment1.bam alignment2.bam alignment3.bam --outdir compare-runs $ NanoComp
NanoComp: 如果你有多个纳米孔样本需要比较,NanoComp则能同时对它们进行质量评估,方便你进行横向对比,快速发现批次效应或异常样本。
我们采用了标准的单菌基因组组装分析流程: Nanocomp质控:对原始.fastq数据进行质量评估,统计reads数量、读长和碱基质量。
对于 ONT 及其类似原理的平台(如华大序风CycloneSEQ-WT02),其下机数据质量相对较低,大家可以使用 nanopack 套件 (如NanoPlot,nanocomp,chopper等)对数据质量进行查看以及进行过滤修剪
对于三代纳米孔测序平台,查看数据统计信息和质量最常用的就针对牛津纳米孔(ONT)数据开发的Nanopack分析套装,如NanoPlot,NanoComp和NanoQC,以及老牌质控软件fastp针对三代长度长数据优化的