IsoQuant:长读长转录组分析的革命性工具 这款工具的主角,是2023年发表于《Nature Biotechnology》上的IsoQuant。 更值得一提的是,IsoQuant兼容PacBio和ONT平台的原始数据,这使其在三代转录组研究中脱颖而出。 其次,IsoQuant的操作堪称“一键式”:只需一行命令,就能从质控后的FASTQ文件直达最终的表达矩阵结果,省去了诸多中间手动步骤。 这些结果不仅覆盖了标准定量指标,还突出了IsoQuant在发现新型Isoform方面的优势,为下游的差异表达分析或功能注释提供了坚实基础。 权威评测的背书:表现最佳 IsoQuant的可靠性并非空谈。 注意事项:保留Poly(A)尾 值得特别强调的是,IsoQuant的默认输入假设转录本序列带有Poly(A)尾。
IsoQuant 能对转录本进行重构以及定性,并且具有较高的精准度和召回率。如果提供参考基因组,IsoQuant 能根据注释文件中转录本内含子和外显子的结构将长度长测序序列回贴到注释的转录本上。 二、软件安装 IsoQuant github:https://github.com/ablab/IsoQuant 版本:v3.3.1 1. conda安装IsoQuant #直接使用conda安装 $ -n isoquant python=3.8 isoquant # 激活isoquant的conda环境 $ conda activate isoquant 2. 测试IsoQuant是否安装成功 $ isoquant.py --test IsoQuant利用自带数据进行软件的测试,如果最后显示IsoQuant pipeline finished 和 TEST PASSED Nature Biotechnology. 2.IsoQuant github : https://github.com/ablab/IsoQuant
表达量定量: 我们可以使用在长读长转录组分析中综合测评表现优异的IsoQuant工具,直接对DRS数据进行处理。 IsoQuant能够在有参考基因组注释的情况下,准确地将reads比对到已知的基因和转录本上,并输出基因水平和转录本水平的表达矩阵(通常以counts或TPM形式呈现)。 转录本信息的获取: IsoQuant在分析过程中,会输出一个名为~_extended_annotation.gtf的文件。这个文件包含了样本中所有已知转录本以及新鉴定出的转录本的完整注释信息。 SQANTI3会将IsoQuant输出的GTF文件与参考基因组注释进行详细比对,为每个转录本打上精确的分类标签。
近两年出现了 IsoQuant(Prjibelski et al., 2023)和 Bambu(Chen et al., 2023)这类工具: • 先把长读比对到基因组,再用图模型或机器学习把 reads Accurate isoform discovery with IsoQuant using long reads.
还有就是老牌RNA-seq分析软件,StringTie2,可以结合short reads(二代测序数据)和 long reads(三代测序数据);IsoQuant 和 StringTie2既能依赖参考基因组注释 由于IsoQuant,Bambu,FLAIR,TAMA,TALON等软件既适用于ONT也适用于PacBio的全长转录组数据,因此后面我将会针对每一个软件的使用出一个教程。
当isocost和isoquant相切的话,损失最小。 ? 所以,有: ? 、 损失函数的性质 未完待续
关于数据分析,采用SQANTI3软件对异构体进行分类,并配合IsoQuant深入分析基因和转录本表达水平(2)。感兴趣自己分析的小伙伴请参考我写的详细教程。 全长转录组 | Iso-Seq 三代测序数据分析流程 (PacBio) (3)-- SQANTI3 v5.2 全长转录组 | 三代全长转录组分析流程(PacBio & ONT )-- IsoQuant