3.如果运行 NanoPlot ,则会产生 NanoStat.txt 文件,结果和单独运行 NanoStat 的结果一样。 直接运行Nanoplot就行 。 NanoPlot 主页网址::https://github.com/wdecoster/NanoPlot 软件安装 #pip install $ pip install NanoPlot $ pip #从官方docker镜像地址下载nanoplot的singularity镜像 $ singularity pull nanoplot.sif docker://nanozoo/nanoplot #使用 $ singularity exec nanoplot.sif NanoPlot 软件使用 #官方例子 $ NanoPlot --summary sequencing_summary.txt --loglength _NanoPlot 结果展示 $ cd SRR21721846_NanoPlot/ #结果文件: NanoPlot-report.html 主要报告文件 LengthvsQualityScatterPlot_dot.html
环境 conda activate nanoplot #NanoPlot质控 echo "NanoPlot --fastq /share/home/xiehs/05.assembly/data/nanopore.fastq.gz -o nanoplot -t 12" > nano.sh #过滤数据 echo "filtlong --min_length 1000 --min_mean_q 80 /share/home/xiehs /05.assembly/data/nanopore.fastq.gz | gzip >clean.filtlong.fq.gz" > filtlong.sh #过滤完质控 echo "NanoPlot --fastq /share/home/xiehs/05.assembly/40.nanopore/nanoplot/clean.filtlong.fq.gz -o clean -t 12" > nano.sh echo "flye --nano-raw /share/home/xiehs/05.assembly/40.nanopore/nanoplot/clean.filtlong.fq.gz -g 5.5m
创建一个包含负二项分布随机数的字符串 paste(rnbinom(150, 5, 0.25), collapse = ",") # 创建另一个包含负二项分布随机数的字符串 )) %>% gt() %>% cols_nanoplot ) # 创建一个gt表格,添加箱线图,并隐藏原始数据列 案例2 dplyr::tibble( a = c(-20, -10, 0, 10, 5) ) |> gt() |> cols_nanoplot ( columns = a, plot_type = "bar", options = nanoplot_options( data_bar_negative_fill_color cols_hide(columns = c(starts_with("norm"), starts_with("day"))) |> fmt_units(columns = units) |> cols_nanoplot starts_with("day"), new_col_name = "nanoplots", new_col_label = md("*Progression*"), options = nanoplot_options
NanoPlot 可以用来对 nanopore 数据进行统计绘图,输入文件为 fastq 格式,绘图时需要调用 NanoStat 进行统计。 NanoPlot 利用这些统计信息进行绘图,最终会生成一个网页格式文件,包括序列读长的直方图、序列读长与序列平均质量的散点图等。 NanoPlot 绘制质控图 方法一:NanoPlot 质控 NanoPlot --fastq nanopore.fastq.gz -o nanoplot 方法二:对 guppy 生成的 sequencing_summary.txt 的绘图 NanoPlot --summary output/sequencing_summary.txt --loglength -o summary 选项参数: -t:线程数目 filtlong --min_length 2000 --min_mean_q 90 nanopore.fastq.gz | gzip >nanopore.filtlong.fq.gz 过滤完质控 NanoPlot
list conda environments: base * /Nano3/nanopore/miniconda3 nano /Nano3/nanopore/miniconda3/envs/nano nanoplot /Nano3/nanopore/miniconda3/envs/nanoplot py2 /Nano3/nanopore/miniconda3/envs/py2 test /Nano3/nanopore export2graphlan mamba install -y manta mamba install -y strelka mamba install -y lumpy-sv 2.3 使用虚拟环境安装软件 nanoplot conda create -n nanoplot -y nanoplot medaka medaka 网址:https://github.com/nanoporetech/medaka conda create source /ifs1/Software/miniconda3/bin/activate nanoplot 2.5 不激活虚拟环境使用 目前 bioconda 提供了一个 conda run
mamba install -y fastqc multiqc mamba install -y trimmomatic mamba install -y fastp mamba create -n nanoplot -y nanoplot #安装基因组拼接相关工具 mamba install -y velvet mamba install -y flye mamba install -y miniasm mamba xiehs 07:45:09 ~ $ conda activate /share/Software/miniconda3/envs/test (test) xiehs 07:45:19 ~ $ which NanoPlot /share/Software/miniconda3/envs/test/bin/NanoPlot 1.4 配置 PATH 变量 可以将管理员安装生物软件目录配置到每个用户.bashrc
./ conda activate nanoplot #Arabidopsis thaliana参考序列下载 https://www.ncbi.nlm.nih.gov/data-hub/taxonomy
#质控的NanoFilt,pip或bioconda安装 pip install nanofilt NanoPlot #minimap2,编译或者下载预编译的二进制文件均可,这里编译 git clone .. # conda安装软件 conda install -c bioconda diamond blast seqkit last yacrd -y #查看质量,fastq最常用,这里用官方的试试 NanoPlot
mamba install -y fastqc multiqc mamba install -y trimmomatic mamba install -y fastp mamba create -n nanoplot -y nanoplot 安装基因组拼接相关工具 mamba install -y velvet mamba install -y flye mamba install -y miniasm mamba
它能够满足不同层次的质控需求: NanoPlot: 专为单个样本设计,能够生成详尽的测序质量报告和可视化图表,让你对数据概况一目了然。
质量评估(Quality Control, QC): 我们可以使用经典的NanoPlot工具,对basecalling后的数据进行全面的质量评估,包括但不限于reads的平均质量分数分布、长度分布、数据产量等
对于 ONT 及其类似原理的平台(如华大序风CycloneSEQ-WT02),其下机数据质量相对较低,大家可以使用 nanopack 套件 (如NanoPlot,nanocomp,chopper等)对数据质量进行查看以及进行过滤修剪
对于三代纳米孔测序平台,查看数据统计信息和质量最常用的就针对牛津纳米孔(ONT)数据开发的Nanopack分析套装,如NanoPlot,NanoComp和NanoQC,以及老牌质控软件fastp针对三代长度长数据优化的