之前一直没注意平台上的Rarefaction是怎么做的,看了一下用的是Mothur。本文mark一下Mothur做rarefaction的方法。 ? 综合命令为 mothur > rarefaction.single(list=otu.list,calc=sobs-chao-ace, abund=10,iters=1000,freq=1000) ? Reference https://www.mothur.org/wiki/Rarefaction.single https://mothur.org/wiki/Rarefaction.shared
目前IF:7.267 GigaScience在上个月28号出了一篇文章,将Mothur分析16S扩增子的全套流程整合到了Galaxy平台上,推出一个新工具Galaxy mothur Toolset。 由于Mothur (https://www.mothur.org) 在命令行中操作,需要一定的代码基础;而Galaxy (https://galaxyproject.org/) 具有良好的操作界面 作者将125+Mothur工具整合进Galaxy,并与第三方可视化软件集成GmT,同时具有两者的优势。 并利用MiSeq standard operating procedure (SOP) data set (https://www.mothur.org/wiki/MiSeq_SOP) 进行了测试。 了解Mothur及16S分析的人对上述流程应该很熟悉,大胆推测一下使用该工具应该还是小白居多。 由于我觉得没必要再安装并详细体验该工具,此文完~ 当然感兴趣的同学可以自己进一步研究测试。
MOTHUR除了可以处理qiime能处理的数据,还可以处理Sanger,Pacbio和IonTorrent测序数据,一次是最高引用的16S数据分析软件之一。 使用qiime和mothur分析16S数据 分析16S测序数据,这两个软件有很多共同点,如质控、聚类、分类(物种注释)等。 Mothur有一个特别的步骤,所有的序列必须比对到一个模板数据库,任何没有重叠的序列将被移除。 第二步,挑选OTU和分配代表序列 qiime最常用的是uclust,使用用户指定的序列相似度参数(如97%),mothur使用类似的方法。 另外,我们介绍了两个最常用的生信数据分析工具qiime和mothur。
目前广泛使用的序列分类学鉴定工具有RDP,QIIME,mothur等。他们用的都是RDP的方法,但是所使用的的数据库不同。 mothur以SILVA的子数据库SILVAM作为参考数据库。 SINTAX算法就不写了,估计也没有人想看。 直接说结果,作者拿SINTAX v1.0, RDP v2.12, QIIME v1.9.1, mothur v1.36.1进行了对比。
Rscript 在Linux中调用perl脚本并输出结果,示例如下: Rscript r01.R 命令:sh 执行多命令整合成shell脚本,示例如下: 对于安装的软件,调用时则需要完整的绝对路径,例如Mothur ,需要输入/sdd/userLogin/zhengjw/softwares/mothur/mothur然后回车来输入命令,或者直接输入命令,示例如下: 对于经常用到的软件,我们可以将其路径添加到环境变量 PATH,则可以直接调用,首先我们需要修改用户主目录下的配置文件,示例如下: 最后执行source激活环境变量: source ~/.bashrc 这时候便可以直接调用mothur: 3.4任务管理
02 重要的背景2 对于物种注释的算法,目前主流的有RDP classifier ,SINTAX , Mycofier,MOTHUR。 MOTHUR使用k-nearest neighbor (kNN),并基于k-mer (k=8)提取序列特征。 并与现有的真菌预测方法(RDP classifier, SINTAX and MOTHUR);及预测除真菌以外其他物种的方法进行了对比。 k-mer 和 g-spaced预测成功率 02 准确性更高 funbarRF 和 MOTHUR准确性~89%, 比RDP 和 SINTAX高2%。RDP的稳定性最强,funbarRF稳定性最差。 但是funbarRF单独预测出的物种数(370)远高于MOTHUR(141)。 c.不同算法之间得到物种的差异。b.不同算法之间准确性差异。
我们还将我们的管道与QIIME和mothur(分别为1.8.0版和1.39.3版)对金标准数据进行了比较。 由于QIIME和mothur目前不支持基于非重叠读取的从头OTU聚类,因此我们在R1读取中运行QIIME和mothur。选择的参数设置与Hybrid-denovo的设置相当。 尽管我们的流程生成的OTU数量较少,但我们检测到的属数比mothur和QIIME多。 我们的管道通常比mothur和QIIME具有更高的ICC(技术复制之间的差异较小)(图3)。相反,在核心OTU和属上,mothur和QIIME的性能分别不佳。 表格1:QIIME,Mothur和Hybrid-denovo之间样本间距离的Mantel相关性。 ?
对于微生物群落分析我们一般采用两两比较法,在Mothur中该指数的计算方法为: 其中ST为所有样品总物种数,SA和SB为样品A与B的样品数,A与B共有物种越少,Whittaker越大。 而且由公式可以看出Whittaker值与总样品数目有关,若是三个样品两两比较,ST即为三个样品物种数目总和,所以所选样品数大于2时Mothur中计算的指数不一定是正数。 Mothur更多指数参见http://www.mothur.org/wiki/Calculators。 02 β多样性距离计算 QIIME2、Mothur等软件均可计算β多样性距离指数。 例如在Mothur中计算方法如下: #计算样品两两之间的距离指数 summary.shared(shared=sample.0.03.0.03.subsample.shared, groups=QC1-
16S流程的选择还真不少,除了引用最多的qiime流程,u/vsearch(usearch是一人一已之力单挑学术界)和mothur(用的人越来越少的感觉),最近又发现了一两个流程,一并分享给大家。 以下内容基本翻译自其官网: LotuS提供完整的轻量级16S / 18S / ITS流程 多路分解并过滤fasta或fastq序列 去噪,将嵌合序列和簇序列去除为非常高质量的OTU,其性能与mothur LotuS不包括样本的数值分析,而是我们设计了LotuS输出,可以轻松地将它们集成到现有的工作流程中,例如使用R,QIIME / mothur或Matlab等统计编程语言。
更多多样性指数请参见http://www.mothur.org/wiki/Calculators。 02 α多样性指数计算 扩增子数据分析常用的工具QIIME2和Mothur均能计算α多样性指数。 在Mothur中summary.single指令进行计算分析,产生多个样品的各种多样性指数计算结果,计算方法如下: summary.single(shared=sample.0.03.0.03.subsample.shared =T) 因为序列总数不一样,测序深度就会有所不同,因此要使得不同样品的多样性指数计算有意义,指数计算必须在统一抽样水平,我们可以设置参数subsample为具体的序列数目,设置subsample=T则Mothur 03 组间箱型图比较 在大规模环境微生物测序中,样品间多样性比较太冗杂,我们一般根据实际情况对样品进行分组,将Mothur计算的多样性指数分组统计进行比较,我么可以采用箱形图来进行展示。 多样性指数的稀释曲线可以使用Mothur中的rarefaction.single指令进行分析产生,rarefaction.single为采用不重复抽样的方法产生多样性指数随序列抽样水平变化的稀释曲线,这里的多样性指数一般为丰度指数
是对QIIME和Mothur有效的补充。 现在被引用了10次,引用它的还都是不错的文章。 结果表明其内存占用与运行时间都优于QIIME、Mothur及R中的vegan包。
rhizosphere soil and root samples and 11 replicates for the stem and leaf samples and were calculated in mothur Microbiome作者的分析流程为mothur,2009年发表目前被近7000次; 另外主流的的软件是Usearch,2010年发表在Bioinformatics,目前引用4947次;原来只是一个小小的高速序列聚类和比对软件 “Introducing mothur: Open-Source, Platform-Independent, Community-Supported Software for Describing and skbio.diversity.alpha.html https://lagunita.stanford.edu/courses/Medicine/MedStats-SP/SelfPaced/about https://www.mothur.org
USEARCH 是继 Mothur 和 QIIME 之后的第三大流行扩增子分析流程,目前已被引用 20,824 次。 与 Mothur 和 QIIME 不同,USEARCH 的 64 位版本以前并不是开源的,只有 32 位版本是开源的,但由于 32 位版本对计算机内存有限制,无法处理大样本数据。
图1 2015年至2024年相关概念的发文量 替代方案: 采用mothur或UPARSE等方法得到OTU。OTU既可以得到属/种水平的信息,同时错误物种带来的影响较小,且能保留稀有物种。
用Mothur中的seq.error命令计算错误率。 A.模拟群落PCR循环导致嵌合体比例增加。 由于模拟群落组成已知,作者首先生成了模拟群落所有可能的嵌合体类型(Mothur中的seq.error命令计算),并和UCHIME检测的嵌合体进行比较,考察不同酶的特异性和灵敏性。
方法 收集了之前的454数据,mothur质控,USEARCH97%聚类OTU。重抽数5,529。
下面是这本书的第二章: 什么是微生物组数据 2.1 测序 16S或者宏基因组测序后,数据使用Qiime或Mothur,比对或者denovo聚类生成OTU表格,注释获得物种分类表,以及相对丰度。
install tabix #-------------------------------------------------------------------------------- #(35)mothur 已安装 apt-get install mothur #-----------------------------------------------------------------------
之前发布来daught和son这些零散的软件,后来打包完善为mothur,发在了3分的AEM上,引用过万。 ? Rob,发布了更好用分析+绘图流程QIIME,整合了200多款软件,引用近1.7万次。 截止2019年11月27日,QIIME 17569次;Usearch 107880次;mothur 11889次,mothur由密西根大学(University of Michigan) 的Dr. QIIME和Mothur都推荐使用UPARSE聚类。 https://scholar.google.co.jp/citations?user=RzVMRc0AAAAJ&hl=en&oi=ao ? 实验基本思路:取样—提DNA—第一轮PCR—第二轮PCR—测序 分析基本思路:质控—挑选代表序列OTU/ASV—物种注释—生成Feature表 —多样性分析(整体)—差异比较/机器学习(局部) 常用软件:Mothur
第二步,统计细菌的多样性,作者没有使用最广泛使用的qiime、mothur、vsearch等软件,而是使用了bowtie2去比对一个自建的参考序列集。