首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏简说基因

    MUMmer:基因组比对神器

    大家好,今天我要给大家介绍一款在基因组比较分析领域非常受欢迎的工具——Mummer。无论你是正在研究基因组的进化、变异,还是想要比较不同物种或不同品系的基因组差异,Mummer都能成为你的得力助手。 Mummer是一款用于快速比较两个大基因组序列(如细菌基因组)的软件工具。它能够找出两个基因组之间的相似性和差异性,包括单核苷酸多态性(SNP)、插入和删除等。 这些图形直观地展示了基因组之间的相似性和差异性,让我们能够一目了然地看到结果。 通过Galaxy平台,你可以轻松启动Mummer分析,进行基因组比较分析,而无需担心安装和配置的问题。 1. 上传数据:首先,将你要比较的基因组序列数据上传到Galaxy平台。 2. 如果你正在研究基因组的进化、变异或比较不同物种的基因组差异,不妨试试Mummer吧!相信它一定会给你带来意想不到的收获!

    1.1K10编辑于 2024-12-23
  • 来自专栏分子生物学翻译

    基因组扩增》—— 第一章 基因组扩增基本原则

    gDNA 扩增必须满足以下要求:①保证足够高的基因组覆盖度,及尽可能将人类基因的 3 × 10^9^核苷酸尽可能全部扩增 ;②保证原始序列的构成不变,要避免基因拷贝数的缺失(包括父源和母源),同时也不可以人工引物突变 ---2 基于PCR技术对基因组扩增的初次尝试 第一次扩增基因组使用了一种非变性引物(non-degenerated primers),这些引物的结合位点是基因组中的重复Alu motifs部分中最保守的区域 其中,ADO 率高达 68%,甚至比单细胞基因组扩增检测到的偏好性还高,这表明,iPEP-PCR 并不适用于单细胞基因组分析 。 Phi29 DNA聚合酶活性超高,得到的扩增子的片段也较大(>10kb),有利于提高单细胞基因组覆盖度。 一项研究表明,MALBAC尽管未解决随机引物的问题,但对单细胞基因组覆盖度达到了最高(93%),这就使得MALBAC方法对于后续的基因组分析具有巨大优势。

    1.2K20编辑于 2022-12-08
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (1)

    ,填补了此前几十年人类基因组研究留下的空白:大约 8% 的人类基因组序列「黑洞」,这些区域因为序列复杂性,一直无法被破译,尽管 2003 年国际人类基因组计划(HGP)曾经号称已经「完成了」人类基因组图谱绘制的工作 基因组版块先主要以人类重测序分析为主,后期陆续加入小鼠,动植物(挖坑,思路和使用软件类似)。 癌症基因组还包括大规模结构变异,例如大的插入、缺失、逆转、重复、易位和基因融合, 使得三代测序及分析能够提供有关癌症基因组复杂性最全面的观点。 本次以人类基因组重测序变异分析为引,先分享PacBio的分析流程,然后是ONT平台的分析流程,还会加入串联重复序列,染色体分型,拷贝数变异,融合基因以及基因组甲基化修饰的分析。 先放一张PacBio人类基因组变异分析的流程图,我们会根据流程图的顺序讲解每个软件的具体使用方法,最后串联成 pipeline 进行数据的批量分析,我们下节见! 图片

    82150编辑于 2023-10-19
  • 来自专栏生信修炼手册

    基因组数据CNV分析简介

    除了利用aCGH和snp芯片来检测CNV之外,也可以通过NGS数据来分析CNV, 比如基因组外显子测序。 针对基因组CNV的检测,还针对开发了一种称之为CNV_seq的测序策略,指的是低深度基因组测序,只需要5X的测序深度,就可以有效的检测CNV。 本文根据一篇2015年的综述来简单介绍下基因组CNV分析的策略,文章标题如下 Whole-genome CNV analysis: advances in computational approaches 当插入片段长度过长或者过短时,都代表着基因组发生了结构变异,如上图中的两个阈值,图示如下 ? 以上两幅图来自文献Jan O. 另外一端比对不上,可能是存在CNV, 通过将单独的reads进行拆分,使其能够正确比对到参考基因组上,拆分的点就是CNV的断裂点。

    4.1K20发布于 2019-12-19
  • 来自专栏育种数据分析之放飞自我

    学习 | BLUP与基因组选择

    10. BLUP到GBLUP的过渡 ? ? ? 11. 指数选择 ? 12. GBLUP介绍 ? ? ? 13. 基因组选择 ? ? 14. 基因组选择的优势 ? 15. 基因组选择适合的性状 ? 基因组选择与近交系数 模拟数据显示,GS相对于传统BLUP,能够降低近交系数。因为孟德尔抽样误差可以被估计,这样相似度高的同胞不会进行组配。

    2K20发布于 2020-04-27
  • 来自专栏生信技能树

    小鼠基因组数据分析

    :22 control_1_val_1.fq.gz 44G Jul 1 10:22 control_2_val_2.fq.gz 43G Jul 1 10:29 F03_1_val_1.fq.gz 45G 小鼠WGS数据分析准备工作 一般来说,可以选择最新版小鼠参考基因组(mm10)了,如果你实在有其它需求,也可以自行选择其它版本。 /UCSC/mm10/Mus_musculus_UCSC_mm10.tar.gz nohup tar zxvf Mus_musculus_UCSC_mm10.tar.gz & 下载全部成功后,应该如下 dbsnp $snp \ -O ${sample}_raw.vcf \ 1>${sample}_log.HC done 其实这样的shell脚本是很烂的, 因为这个小鼠基因组数据太大 , 14, 15, 16, 17, 18, 19, 2, 3, 4, 5, 6, 7, 8, 9, MT, X, Y] 也就是说我们给的vcf文件里面的染色体是没有chr这个前缀,可是我们给的参考基因组里面却有这个前缀

    2.9K20发布于 2018-08-16
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (5)-- pbsv

    目前该技术广泛应用于基因组Denovo组装、全长转录本检测、宏基因组基因组重测序等多个方向,并且在染色体结构变异(Structure Variation, SV)的检测中有着不可替代的优势。 据统计,基因组结构变异可能导致的遗传性疾病已经超过1,000种,对于每个人来讲其基因组都有至少20,000个的结构变异,这些变异带来的影响或许比SNVs或InDels带来的影响更大。 4.PAV,Phased Assembly Variant Caller,文章于2021年发表于Science (11),github更新到2023年10月13号(version 2.3.4)。 获得单个或者所有样本的结构变异和基因型,.svsig.gz到.vcf 具体分析命令 数据我们还是使用德系犹太人家系:HG002(子)、HG003(父)、HG004(母),具体参考基因组 - 人类基因组变异分析 --hifi,--ccs Use options optimized for HiFi reads: -S 0 -P 10.

    2.1K00编辑于 2023-11-24
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析 (PacBio)(6)-- ANNOVAR

    如果将个体基因组与参考基因组相比,变异的数量是巨大的。 据估计(1),全球范围内人类的基因组中总共有超过8800万个变异(包括约8470万个单核苷酸多态性、360万个短插入/缺失变异和约6万个结构变异)。 但如果只考虑你和我两个人,我们基因组上的差别并没有这么多,因为在上述8800万个变异位点上我们的序列很大可能是相同的。 实际上,如果我们和人类参考基因组GRch38相比,那么我们的基因组差异大概在400-500万个(其中超过99.9%是单核苷酸多态性和短片段插入缺失变异),手动检查每个位点非常耗时且有些不切实际。 ANNOVAR能够利用最新的数据来分析各种基因组中的遗传变异。

    1.7K21编辑于 2023-12-07
  • 来自专栏三代测序-说

    基因组 | 三代长读长基因组组装 -- Canu

    今天我们介绍一款用于三代长度长测序数据(如PacBio和纳米孔测序)的基因组de novo拼接工具 -- Canu,既适用于小基因组又适用于大基因组的组装,最早是为了应对低碱基质量(high-noise (NHGRI)基因组信息学部门的Sergey Koren博士(图1)。 他在基因组组装和单分子测序算法领域具有深厚的研究背景,开发了 Canu和 HiCanu等基因组组装软件,广泛应用于从微生物到人类的各种基因组组装项目。 长读长的单分子测序技术彻底革新了从头基因组组装(de novo assembly)的方法,并使得构建参考级别质量(reference-quality)的基因组成为可能。 这里设置为 4.8m,表示预估的基因组大小为 4,800,000 个碱基对。

    78421编辑于 2025-05-29
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析 (PacBio)(7)-- AnnotSV

    基因组结构变异(structure variant, SV)是基因组变异的重要组成部分,大片段插入(Insertion, INS)、缺失(Deletion, DEL)、倒位(Inversion, INV 第三代基因组测序因其读长较长,可轻松跨越重复区域和基因组复杂区域,能够更全面的检测基因组的SV。 它可以把鉴定出的结构变异与各种已知的功能基因组数据库进行比对,给出丰富的注释信息,其中包括 (1): 基因注释:使用refSeq或者Ensembl基因数据库注释结构变异重叠的已知基因。 ACMG,全称为American College of Medical Genetics and Genomics美国医学遗传学与基因组学学会。

    1.4K10编辑于 2023-12-09
  • 来自专栏三代测序-说

    基因组 | 三代长读长基因组组装 -- Flye

    今天我们介绍一款用于三代长度长测序数据(如PacBio和纳米孔测序)的基因组de novo拼接工具 -- Flye,可用于进行小型细菌到哺乳动物基因组的组装。 准确的基因组组装常常受到重复区域的干扰。尽管单分子长读长测序数据比短读长数据能更好的解析基因组中的重复序列,但大多数长读长组装算法并不能提供构建最优组装所需的重复特征信息。 此外,Flye 还提供了专门用于宏基因组组装的模式。 目前,Flye 对二倍体基因组的组装会输出合并(collapsed)的组装结果。 ,本示例 4.6m 意为 4.6Mb --iterations 纠错次数可以改到5,默认是1 对于模式的选择需要根据数据类型: Oxford Nanopore(ONT) 对于 R10 测序数据,请使用 对于较早期的 ONT 数据(例如 R7 或旧版 R9 化学试剂),请使用 --nano-raw,预期错误率为 10-15%。

    75021编辑于 2025-05-27
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (4)-- DeepVariant

    我们对下机数据进行比对分析 (pbmm2软件),提取基因组中所有的潜在多态性SNP位点和小片段插入/缺失InDel位点(DeepVariant软件),后期再根据质量值、深度、重复性等因素做进一步的过滤筛选 从测序数据中进行准确的变异检测也是生物学、医学研究和精准医学的基础我们对下机数据进行比对分析 (pbmm2软件),提取基因组中所有的潜在多态性SNP位点和小片段插入/缺失InDel位点(DeepVariant 我们对下机数据进行比对分析,提取基因组中所有的潜在多态性SNP位点和小片段插入/缺失InDel位点,再根据质量值、深度、重复性等因素做进一步的过滤筛选,最终得到高可信度的SNP数据集并注释。 使用官方推荐安装方式pull docker镜像#指定DeepVariant版本,这次安装为最新版本v1.6.0, 2023年10月24日发布。 # --regions "chr20:10,000,000-10,010,000" 可以指定变异检测范围HG002_1,HG003,HG004实际样本运行:#HG002_1$ nohup docker

    2.3K21编辑于 2023-11-12
  • 来自专栏生信菜鸟团

    基因组癌症分析(PCAWG)文献精读

    基因组癌症分析(Pan-Cancer Analysis of Whole Genomes 缩写:PCAWG)项目旨在对38种不同肿瘤类型的2600多种原发癌及其配对正常组织进行了基因组测序和综合分析 在PCAWG的主导下,来自全球700个科学家完成了对2658份癌症样本做了基因组测序工作。 为了促进各种肿瘤类型之间的比较,所有肿瘤和匹配的正常基因组均经过统一的比对和变异检测算法,并且必须通过严格的质量控制测试。 identifies driver rearrangements promoted by LINE-1 retrotransposition. 5 FEB 2020, Nature Genetics ---- 10

    1.4K11发布于 2020-07-02
  • Sentieon | 鸡基因组(WGS)分析流程

    今天给大家介绍的是基于 Sentieon 软件开发的用于鸡基因组测序数据的自动化流程脚本。 测试鸡样本测序深度55.26X,从FASTQ到VCF流程分析最快用时29.21分钟,大幅缩短了鸡的基因组WGS分析时间,有效加快畜禽的分子育种进程。 10. 脚本应用示例使用上述脚本对鸡基因组测序数据分析的测序结果,具体样本信息如下表所示:类别详情物种IDGallus_gallus物种名和倍性鸡(二倍体)参考基因组GCF_016699485.2_bGalGal1 从FastQ到VCF流程分析最快用时29.21分钟,大幅缩短了鸡的基因组WGS分析时间,有效加快畜禽的分子育种进程。

    27010编辑于 2025-11-11
  • 来自专栏Sentieon

    Sentieon | 水稻基因组(WGS)分析流程

    今天给大家介绍的是基于 Sentieon 软件开发的用于水稻基因组测序数据的自动化流程脚本。 测试水稻样本测序深度36.98X,从FASTQ到VCF流程分析最快用时8分钟,大幅缩短了水稻基因组WGS分析时间,有效加快水稻的分子育种进程。 10. 脚本应用示例使用上述脚本对水稻基因组测序数据分析的测序结果,具体样本信息如下表所示:类别详情物种IDOryza_sativa物种名和倍性水稻(二倍体)参考基因组GCF_034140825.1_ASM3414082v1 从FastQ到VCF流程分析最快用时8分钟,大幅缩短了水稻的基因组WGS分析时间,有效加快作物的分子育种进程。

    39710编辑于 2025-10-29
  • 来自专栏腾讯技术工程官方号的专栏

    人类基因组分析提速10倍的背后:TCS 服务垂直行业的探索

    近日腾讯云国内首发二代基因测序FPGA加速方案,将人类基因组数据分析从业内平均水平的30小时降低到了不到3小时,在业内引起不小反响,也吹响了腾讯云进军基因计算行业的号角[1]。 数据量大表现在一个人的基因组测序数据就高达几百G,同时对这些数据需要进行大量的计算才能找出我们想要的信息。 以人的基因组测序数据分析为例,二代测序当前普遍需要的计算力达到~500核时,而三代测序需要的计算力更是高达数万核时。 让业内标准的30x的NA12878样本,分析时间从通常的30小时缩减到了10小时。 [1]国内首个二代基因测序FPGA加速方案落地腾讯云,人类基因组分析从30小时到2.8小时http://mp.weixin.qq.com/s/Bm5nHlPQjbH0iru3m8S-Ag 本文转自“腾讯架构师

    1.5K90发布于 2018-01-02
  • 来自专栏育种数据分析之放飞自我

    基因组选择介绍及实践-1

    2, 定义 基因组选择(Genomic Selection, GS), 利用覆盖基因组的高密度分子遗传标记进行的标记辅助选择. ? Genomic selection, 基因组选择 选择进展的定义 ? 肉质性状)效果较差 不能早期度量的性状, 效果较差 分子标记辅助育种(MAS) 局限: 需要先对主效基因或者QTL进行检测 不同群体变化较大 标记可解释的遗传变异百分比较低 在动物育种中的应用非常有限 基因组选择 data = gphe) # 构建模型 summary(moda_as)$varcomp #结果 # GBLUP sommer的操作代码 gdat = gs_geno # 重命名数据 gdat[1:10,1 :10] # 预览数据 G = A.mat(gdat-1) # sommer计算G矩阵时, 支持的是-1,0,1, 所以需要转化 time_sommer = system.time({ modg_mm

    2.4K20发布于 2019-06-13
  • 来自专栏作图丫

    ComplexHeatmap 绘制基因组突变景观图

    ComplexHeatmap R包是Zuguang Gu编写的,也是现在文章中利用的较多的R包。这个包能实现的功能很强大,今天给大家介绍一下利用ComplexHeatmap R包中的oncoprint绘制突变景观图。

    1.3K40编辑于 2022-03-29
  • 来自专栏生信菜鸟团

    中国人肝癌基因组项目

    PCAWG 大规模的基因组研究因为测序深度较浅而无法完全分析肝癌基因组的亚克隆结构。因此作者开展了 Chinese Liver Cancer Atlas(CLCA)中国人肝癌图谱项目。 研究结果 体细胞突变图谱:共鉴定出了9287828个体细胞突变,其中的驱动基因分为:编码区(23个)和非编码区(31个),有10个驱动突变是具有显著性的克隆或亚克隆突变 突变特征分析:17个单碱基取代( 每个样本突变数量也和作者上传的文件不一致: 看到这个比例约为3%,也就是目前人类基因组已知的区域的比例。 比如通常的外显子测序,就只测1.5%~ 3% 左右的基因组区域,其余的非编码区或者未知的区域一般不测。所以得到的9287828个突变位点,只有 283223个约3%的突变位点可以被注释到。

    41210编辑于 2024-03-18
  • 来自专栏作图丫

    GenVisR 绘制基因组突变景观图

    上期分享了ComplexHeatmap R包中的oncoprint用于绘制基因组突变景观图(上期精彩点击ComplexHeatmap 绘制基因组突变景观图),小伙伴们很感兴趣,后台收到很多测试和代码的需求 通过上期分享发现绘制基因组突变景观图也不是很复杂,理顺了还是比较容易的。 今天小编仍带给大家另外一款可以绘制基因组突变景观图的R包-GenVisR,这款R包可以绘制: mutation overview graphic mutation hotspot graphic (12)coverageSpace:基因组测序长度(bp),默认是44100000(44.1M),可根据测序芯片类型调整。 ),plot_proportions=TRUE) #绘制突变类型比例柱状图,注意要设置section_heights=c(3,10,3),而不是section_heights=c(3,10),此时section

    1.6K20编辑于 2022-03-29
领券