首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏简说基因

    MUMmer:基因组比对神器

    大家好,今天我要给大家介绍一款在基因组比较分析领域非常受欢迎的工具——Mummer。无论你是正在研究基因组的进化、变异,还是想要比较不同物种或不同品系的基因组差异,Mummer都能成为你的得力助手。 Mummer是一款用于快速比较两个大基因组序列(如细菌基因组)的软件工具。它能够找出两个基因组之间的相似性和差异性,包括单核苷酸多态性(SNP)、插入和删除等。 这些图形直观地展示了基因组之间的相似性和差异性,让我们能够一目了然地看到结果。 通过Galaxy平台,你可以轻松启动Mummer分析,进行基因组比较分析,而无需担心安装和配置的问题。 1. 上传数据:首先,将你要比较的基因组序列数据上传到Galaxy平台。 2. 如果你正在研究基因组的进化、变异或比较不同物种的基因组差异,不妨试试Mummer吧!相信它一定会给你带来意想不到的收获!

    1.1K10编辑于 2024-12-23
  • 来自专栏分子生物学翻译

    基因组扩增》—— 第一章 基因组扩增基本原则

    ---2 基于PCR技术对基因组扩增的初次尝试 第一次扩增基因组使用了一种非变性引物(non-degenerated primers),这些引物的结合位点是基因组中的重复Alu motifs部分中最保守的区域 其中,ADO 率高达 68%,甚至比单细胞基因组扩增检测到的偏好性还高,这表明,iPEP-PCR 并不适用于单细胞基因组分析 。 对于低起始量和降解样本,基于PCR方法的基因组扩增方法优于MDA扩增。 迄今为止,PicoPlex 的基因组扩增技术主要应用于胚胎移植诊断领域。在该领域,PicoPlex 的单个胚叶细胞的基因组扩增产物通过aCGH方法检测CNA突变并选择整倍体胚胎进行后续胚胎移植。 一项研究表明,MALBAC尽管未解决随机引物的问题,但对单细胞基因组覆盖度达到了最高(93%),这就使得MALBAC方法对于后续的基因组分析具有巨大优势。

    1.2K20编辑于 2022-12-08
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (1)

    ,填补了此前几十年人类基因组研究留下的空白:大约 8% 的人类基因组序列「黑洞」,这些区域因为序列复杂性,一直无法被破译,尽管 2003 年国际人类基因组计划(HGP)曾经号称已经「完成了」人类基因组图谱绘制的工作 基因组版块先主要以人类重测序分析为主,后期陆续加入小鼠,动植物(挖坑,思路和使用软件类似)。 癌症基因组还包括大规模结构变异,例如大的插入、缺失、逆转、重复、易位和基因融合, 使得三代测序及分析能够提供有关癌症基因组复杂性最全面的观点。 本次以人类基因组重测序变异分析为引,先分享PacBio的分析流程,然后是ONT平台的分析流程,还会加入串联重复序列,染色体分型,拷贝数变异,融合基因以及基因组甲基化修饰的分析。 先放一张PacBio人类基因组变异分析的流程图,我们会根据流程图的顺序讲解每个软件的具体使用方法,最后串联成 pipeline 进行数据的批量分析,我们下节见! 图片

    81450编辑于 2023-10-19
  • 来自专栏生信修炼手册

    基因组数据CNV分析简介

    除了利用aCGH和snp芯片来检测CNV之外,也可以通过NGS数据来分析CNV, 比如基因组外显子测序。 针对基因组CNV的检测,还针对开发了一种称之为CNV_seq的测序策略,指的是低深度基因组测序,只需要5X的测序深度,就可以有效的检测CNV。 本文根据一篇2015年的综述来简单介绍下基因组CNV分析的策略,文章标题如下 Whole-genome CNV analysis: advances in computational approaches 当插入片段长度过长或者过短时,都代表着基因组发生了结构变异,如上图中的两个阈值,图示如下 ? 以上两幅图来自文献Jan O. 另外一端比对不上,可能是存在CNV, 通过将单独的reads进行拆分,使其能够正确比对到参考基因组上,拆分的点就是CNV的断裂点。

    4.1K20发布于 2019-12-19
  • 来自专栏育种数据分析之放飞自我

    学习 | BLUP与基因组选择

    基因组选择 ? ? 14. 基因组选择的优势 ? 15. 基因组选择适合的性状 ? 16. 基因组选择与近交系数 模拟数据显示,GS相对于传统BLUP,能够降低近交系数。 因为孟德尔抽样误差可以被估计,这样相似度高的同胞不会进行组配。 但是,因为GS降低了世代间隔,每年的近交增量可能会比传统方法更大。 ?

    1.9K20发布于 2020-04-27
  • 来自专栏生信技能树

    小鼠基因组数据分析

    小鼠WGS数据分析准备工作 一般来说,可以选择最新版小鼠参考基因组(mm10)了,如果你实在有其它需求,也可以自行选择其它版本。 dbsnp $snp \ -O ${sample}_raw.vcf \ 1>${sample}_log.HC done 其实这样的shell脚本是很烂的, 因为这个小鼠基因组数据太大 13, 14, 15, 16, 17, 18, 19, 2, 3, 4, 5, 6, 7, 8, 9, MT, X, Y] 也就是说我们给的vcf文件里面的染色体是没有chr这个前缀,可是我们给的参考基因组里面却有这个前缀

    2.9K20发布于 2018-08-16
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (5)-- pbsv

    目前该技术广泛应用于基因组Denovo组装、全长转录本检测、宏基因组基因组重测序等多个方向,并且在染色体结构变异(Structure Variation, SV)的检测中有着不可替代的优势。 据统计,基因组结构变异可能导致的遗传性疾病已经超过1,000种,对于每个人来讲其基因组都有至少20,000个的结构变异,这些变异带来的影响或许比SNVs或InDels带来的影响更大。 三代测序的长读长能够很有效的跨越覆盖识别出结构变异位点,得到结构变异的全貌,轻松测通基因组上的复杂重复区域。 通过三代测序技术,在人类基因组中发现了数万个结构变异,而这些变异通常无法通过二代测序技术进行识别(图2)。 获得单个或者所有样本的结构变异和基因型,.svsig.gz到.vcf 具体分析命令 数据我们还是使用德系犹太人家系:HG002(子)、HG003(父)、HG004(母),具体参考基因组 - 人类基因组变异分析

    2K00编辑于 2023-11-24
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析 (PacBio)(6)-- ANNOVAR

    如果将个体基因组与参考基因组相比,变异的数量是巨大的。 据估计(1),全球范围内人类的基因组中总共有超过8800万个变异(包括约8470万个单核苷酸多态性、360万个短插入/缺失变异和约6万个结构变异)。 但如果只考虑你和我两个人,我们基因组上的差别并没有这么多,因为在上述8800万个变异位点上我们的序列很大可能是相同的。 实际上,如果我们和人类参考基因组GRch38相比,那么我们的基因组差异大概在400-500万个(其中超过99.9%是单核苷酸多态性和短片段插入缺失变异),手动检查每个位点非常耗时且有些不切实际。 ANNOVAR能够利用最新的数据来分析各种基因组中的遗传变异。

    1.7K21编辑于 2023-12-07
  • 来自专栏三代测序-说

    基因组 | 三代长读长基因组组装 -- Canu

    今天我们介绍一款用于三代长度长测序数据(如PacBio和纳米孔测序)的基因组de novo拼接工具 -- Canu,既适用于小基因组又适用于大基因组的组装,最早是为了应对低碱基质量(high-noise (NHGRI)基因组信息学部门的Sergey Koren博士(图1)。 他在基因组组装和单分子测序算法领域具有深厚的研究背景,开发了 Canu和 HiCanu等基因组组装软件,广泛应用于从微生物到人类的各种基因组组装项目。 长读长的单分子测序技术彻底革新了从头基因组组装(de novo assembly)的方法,并使得构建参考级别质量(reference-quality)的基因组成为可能。 这里设置为 4.8m,表示预估的基因组大小为 4,800,000 个碱基对。

    73421编辑于 2025-05-29
  • 来自专栏三代测序-说

    基因组 | 三代长读长基因组组装 -- Flye

    今天我们介绍一款用于三代长度长测序数据(如PacBio和纳米孔测序)的基因组de novo拼接工具 -- Flye,可用于进行小型细菌到哺乳动物基因组的组装。 准确的基因组组装常常受到重复区域的干扰。尽管单分子长读长测序数据比短读长数据能更好的解析基因组中的重复序列,但大多数长读长组装算法并不能提供构建最优组装所需的重复特征信息。 此外,Flye 还提供了专门用于宏基因组组装的模式。 目前,Flye 对二倍体基因组的组装会输出合并(collapsed)的组装结果。 如果你正在使用 Flye 或 metaFlye 来组装异质性的细菌基因组或宏基因组数据,可以考虑使用 strainy 来识别和定量异质性,从而揭示被合并(collapsed)的菌株信息。 使用 --meta 选项可以启用宏基因组或覆盖度不均的样本组装模式。

    69021编辑于 2025-05-27
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析 (PacBio)(7)-- AnnotSV

    基因组结构变异(structure variant, SV)是基因组变异的重要组成部分,大片段插入(Insertion, INS)、缺失(Deletion, DEL)、倒位(Inversion, INV 第三代基因组测序因其读长较长,可轻松跨越重复区域和基因组复杂区域,能够更全面的检测基因组的SV。 它可以把鉴定出的结构变异与各种已知的功能基因组数据库进行比对,给出丰富的注释信息,其中包括 (1): 基因注释:使用refSeq或者Ensembl基因数据库注释结构变异重叠的已知基因。 ACMG,全称为American College of Medical Genetics and Genomics美国医学遗传学与基因组学学会。

    1.4K10编辑于 2023-12-09
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (4)-- DeepVariant

    , 是最常见也最简单的一类造成基因组多样性的DNA序列变异。 我们对下机数据进行比对分析 (pbmm2软件),提取基因组中所有的潜在多态性SNP位点和小片段插入/缺失InDel位点(DeepVariant软件),后期再根据质量值、深度、重复性等因素做进一步的过滤筛选 从测序数据中进行准确的变异检测也是生物学、医学研究和精准医学的基础我们对下机数据进行比对分析 (pbmm2软件),提取基因组中所有的潜在多态性SNP位点和小片段插入/缺失InDel位点(DeepVariant 我们对下机数据进行比对分析,提取基因组中所有的潜在多态性SNP位点和小片段插入/缺失InDel位点,再根据质量值、深度、重复性等因素做进一步的过滤筛选,最终得到高可信度的SNP数据集并注释。 数据准备样本参考基因组文件例如上一节pbmm2用到的GCA_000001405.15_GRCh38_no_alt_analysis_set.fna.gz.参考基因组需要samtools进行索引#如果没有安装

    2.3K21编辑于 2023-11-12
  • 来自专栏生信菜鸟团

    基因组癌症分析(PCAWG)文献精读

    基因组癌症分析(Pan-Cancer Analysis of Whole Genomes 缩写:PCAWG)项目旨在对38种不同肿瘤类型的2600多种原发癌及其配对正常组织进行了基因组测序和综合分析 在PCAWG的主导下,来自全球700个科学家完成了对2658份癌症样本做了基因组测序工作。 为了促进各种肿瘤类型之间的比较,所有肿瘤和匹配的正常基因组均经过统一的比对和变异检测算法,并且必须通过严格的质量控制测试。

    1.4K11发布于 2020-07-02
  • Sentieon | 鸡基因组(WGS)分析流程

    今天给大家介绍的是基于 Sentieon 软件开发的用于鸡基因组测序数据的自动化流程脚本。 测试鸡样本测序深度55.26X,从FASTQ到VCF流程分析最快用时29.21分钟,大幅缩短了鸡的基因组WGS分析时间,有效加快畜禽的分子育种进程。 InsertSizeMetricAlgo $SAMPLEID.is_metrics.txt"    timer metrics "$cmd" metrics.ok}使用sentieon driver计算多种测序质量指标,包括:基因组测序指标 脚本应用示例使用上述脚本对鸡基因组测序数据分析的测序结果,具体样本信息如下表所示:类别详情物种IDGallus_gallus物种名和倍性鸡(二倍体)参考基因组GCF_016699485.2_bGalGal1 从FastQ到VCF流程分析最快用时29.21分钟,大幅缩短了鸡的基因组WGS分析时间,有效加快畜禽的分子育种进程。

    25410编辑于 2025-11-11
  • 来自专栏Sentieon

    Sentieon | 水稻基因组(WGS)分析流程

    今天给大家介绍的是基于 Sentieon 软件开发的用于水稻基因组测序数据的自动化流程脚本。 测试水稻样本测序深度36.98X,从FASTQ到VCF流程分析最快用时8分钟,大幅缩短了水稻基因组WGS分析时间,有效加快水稻的分子育种进程。 InsertSizeMetricAlgo $SAMPLEID.is_metrics.txt"    timer metrics "$cmd" metrics.ok}使用sentieon driver计算多种测序质量指标,包括:基因组测序指标 脚本应用示例使用上述脚本对水稻基因组测序数据分析的测序结果,具体样本信息如下表所示:类别详情物种IDOryza_sativa物种名和倍性水稻(二倍体)参考基因组GCF_034140825.1_ASM3414082v1 从FastQ到VCF流程分析最快用时8分钟,大幅缩短了水稻的基因组WGS分析时间,有效加快作物的分子育种进程。

    36910编辑于 2025-10-29
  • 来自专栏育种数据分析之放飞自我

    基因组选择介绍及实践-1

    2, 定义 基因组选择(Genomic Selection, GS), 利用覆盖基因组的高密度分子遗传标记进行的标记辅助选择. ? Genomic selection, 基因组选择 选择进展的定义 ? 肉质性状)效果较差 不能早期度量的性状, 效果较差 分子标记辅助育种(MAS) 局限: 需要先对主效基因或者QTL进行检测 不同群体变化较大 标记可解释的遗传变异百分比较低 在动物育种中的应用非常有限 基因组选择 优点: 无需进行主效基因或者QTL的检测 不依赖于表型信息(候选群) 能够捕获基因组中的全部变异 对于低遗传力, 难以度量的性状提升效果明显 4, 基因组选择流程 ? 动物模型是利用的系谱构建的A矩阵 GBLUP是利用基因组信息构建的G矩阵 一步法(single-setp)是利用系谱和基因组信息构建的H矩阵 5,其它方法 除了GBLUP和Single-step, 还有其它方法用于基因组选择

    2.4K20发布于 2019-06-13
  • 来自专栏作图丫

    ComplexHeatmap 绘制基因组突变景观图

    ComplexHeatmap R包是Zuguang Gu编写的,也是现在文章中利用的较多的R包。这个包能实现的功能很强大,今天给大家介绍一下利用ComplexHeatmap R包中的oncoprint绘制突变景观图。

    1.3K40编辑于 2022-03-29
  • 来自专栏生信菜鸟团

    中国人肝癌基因组项目

    PCAWG 大规模的基因组研究因为测序深度较浅而无法完全分析肝癌基因组的亚克隆结构。因此作者开展了 Chinese Liver Cancer Atlas(CLCA)中国人肝癌图谱项目。 每个样本突变数量也和作者上传的文件不一致: 看到这个比例约为3%,也就是目前人类基因组已知的区域的比例。 比如通常的外显子测序,就只测1.5%~ 3% 左右的基因组区域,其余的非编码区或者未知的区域一般不测。所以得到的9287828个突变位点,只有 283223个约3%的突变位点可以被注释到。

    40410编辑于 2024-03-18
  • 来自专栏作图丫

    GenVisR 绘制基因组突变景观图

    上期分享了ComplexHeatmap R包中的oncoprint用于绘制基因组突变景观图(上期精彩点击ComplexHeatmap 绘制基因组突变景观图),小伙伴们很感兴趣,后台收到很多测试和代码的需求 通过上期分享发现绘制基因组突变景观图也不是很复杂,理顺了还是比较容易的。 今天小编仍带给大家另外一款可以绘制基因组突变景观图的R包-GenVisR,这款R包可以绘制: mutation overview graphic mutation hotspot graphic (12)coverageSpace:基因组测序长度(bp),默认是44100000(44.1M),可根据测序芯片类型调整。

    1.6K20编辑于 2022-03-29
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (2)-- CCS的使用

    一、基因组 PacBio SMRTbell文库的构建流程 1. 基因组SMRTbell文库构建流程 以基因组HiFi文库为例(10-20Kb文库 ) ,图1左所示: 1)通过核酸提取得到基因组DNA(gDNA)后,先利用G-tube管或Megaruptor System 将基因组片段化至合适大小 (一般动植物基因组20 Kb建库,微生物基因组10 Kb建库); 2)通过去除单链悬突、损伤修复和末端修复等步骤,得到完整的双链DNA插入片段; 3)通过将SMRTbell接头连接至双链

    4.7K31编辑于 2023-10-26
领券