首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信修炼手册

    基因组数据CNV分析简介

    除了利用aCGH和snp芯片来检测CNV之外,也可以通过NGS数据来分析CNV, 比如基因组外显子测序。 针对基因组CNV的检测,还针对开发了一种称之为CNV_seq的测序策略,指的是低深度基因组测序,只需要5X的测序深度,就可以有效的检测CNV。 本文根据一篇2015年的综述来简单介绍下基因组CNV分析的策略,文章标题如下 Whole-genome CNV analysis: advances in computational approaches Read-Depth(RD) RD方法利用拷贝数和对应区域测序深度的相关性来进行分析,基本模型是缺失区域的测序深度相对低,而插入区域的测序深度相对高。 综上所述,每种算法各有其优缺点,综合使用多种策略有助于提高检测结果的准确性和敏感性,同时设置对照样本,可以更加有效的分析拷贝数的变化。

    4.1K20发布于 2019-12-19
  • 来自专栏生信技能树

    小鼠基因组数据分析

    有点类似于肿瘤外显子的数据分析流程: As additional controls, each of the variants was compared with the FVB/NJ genome in 小鼠WGS数据分析准备工作 一般来说,可以选择最新版小鼠参考基因组(mm10)了,如果你实在有其它需求,也可以自行选择其它版本。 dbsnp $snp \ -O ${sample}_raw.vcf \ 1>${sample}_log.HC done 其实这样的shell脚本是很烂的, 因为这个小鼠基因组数据太大 13, 14, 15, 16, 17, 18, 19, 2, 3, 4, 5, 6, 7, 8, 9, MT, X, Y] 也就是说我们给的vcf文件里面的染色体是没有chr这个前缀,可是我们给的参考基因组里面却有这个前缀

    2.9K20发布于 2018-08-16
  • 来自专栏生信菜鸟团

    基因组癌症分析(PCAWG)文献精读

    基因组癌症分析(Pan-Cancer Analysis of Whole Genomes 缩写:PCAWG)项目旨在对38种不同肿瘤类型的2600多种原发癌及其配对正常组织进行了基因组测序和综合分析 在PCAWG的主导下,来自全球700个科学家完成了对2658份癌症样本做了基因组测序工作。 为了促进各种肿瘤类型之间的比较,所有肿瘤和匹配的正常基因组均经过统一的比对和变异检测算法,并且必须通过严格的质量控制测试。

    1.4K11发布于 2020-07-02
  • Sentieon | 鸡基因组(WGS)分析流程

    今天给大家介绍的是基于 Sentieon 软件开发的用于鸡基因组测序数据的自动化流程脚本。 测试鸡样本测序深度55.26X,从FASTQ到VCF流程分析最快用时29.21分钟,大幅缩短了鸡的基因组WGS分析时间,有效加快畜禽的分子育种进程。 root:sentieon工具(基因组分析软件)的安装路径。 脚本应用示例使用上述脚本对鸡基因组测序数据分析的测序结果,具体样本信息如下表所示:类别详情物种IDGallus_gallus物种名和倍性鸡(二倍体)参考基因组GCF_016699485.2_bGalGal1 从FastQ到VCF流程分析最快用时29.21分钟,大幅缩短了鸡的基因组WGS分析时间,有效加快畜禽的分子育种进程。

    26110编辑于 2025-11-11
  • 来自专栏Sentieon

    Sentieon | 水稻基因组(WGS)分析流程

    今天给大家介绍的是基于 Sentieon 软件开发的用于水稻基因组测序数据的自动化流程脚本。 测试水稻样本测序深度36.98X,从FASTQ到VCF流程分析最快用时8分钟,大幅缩短了水稻基因组WGS分析时间,有效加快水稻的分子育种进程。 脚本应用示例使用上述脚本对水稻基因组测序数据分析的测序结果,具体样本信息如下表所示:类别详情物种IDOryza_sativa物种名和倍性水稻(二倍体)参考基因组GCF_034140825.1_ASM3414082v1 ASM3414082v1_genomic.fna.gz测试硬件配置CPU为单颗AmpereOne A192-32X内存为512GB DDR5系统为Ubuntu 24.04/Kernel 6.8测试结果使用本文流程对水稻基因组测序数据进行变异检测分析 从FastQ到VCF流程分析最快用时8分钟,大幅缩短了水稻的基因组WGS分析时间,有效加快作物的分子育种进程。

    37710编辑于 2025-10-29
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (1)

    ,填补了此前几十年人类基因组研究留下的空白:大约 8% 的人类基因组序列「黑洞」,这些区域因为序列复杂性,一直无法被破译,尽管 2003 年国际人类基因组计划(HGP)曾经号称已经「完成了」人类基因组图谱绘制的工作 基因组版块先主要以人类重测序分析为主,后期陆续加入小鼠,动植物(挖坑,思路和使用软件类似)。 癌症基因组还包括大规模结构变异,例如大的插入、缺失、逆转、重复、易位和基因融合, 使得三代测序及分析能够提供有关癌症基因组复杂性最全面的观点。 本次以人类基因组重测序变异分析为引,先分享PacBio的分析流程,然后是ONT平台的分析流程,还会加入串联重复序列,染色体分型,拷贝数变异,融合基因以及基因组甲基化修饰的分析。 先放一张PacBio人类基因组变异分析的流程图,我们会根据流程图的顺序讲解每个软件的具体使用方法,最后串联成 pipeline 进行数据的批量分析,我们下节见! 图片

    81650编辑于 2023-10-19
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析 (PacBio)(6)-- ANNOVAR

    如果将个体基因组与参考基因组相比,变异的数量是巨大的。 据估计(1),全球范围内人类的基因组中总共有超过8800万个变异(包括约8470万个单核苷酸多态性、360万个短插入/缺失变异和约6万个结构变异)。 但如果只考虑你和我两个人,我们基因组上的差别并没有这么多,因为在上述8800万个变异位点上我们的序列很大可能是相同的。 实际上,如果我们和人类参考基因组GRch38相比,那么我们的基因组差异大概在400-500万个(其中超过99.9%是单核苷酸多态性和短片段插入缺失变异),手动检查每个位点非常耗时且有些不切实际。 ANNOVAR能够利用最新的数据来分析各种基因组中的遗传变异。

    1.7K21编辑于 2023-12-07
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (5)-- pbsv

    目前该技术广泛应用于基因组Denovo组装、全长转录本检测、宏基因组基因组重测序等多个方向,并且在染色体结构变异(Structure Variation, SV)的检测中有着不可替代的优势。 本期我们就继续沿着分析流程图一起看看基于比对结果检测染色体结构变异(SV)分析方法。 据统计,基因组结构变异可能导致的遗传性疾病已经超过1,000种,对于每个人来讲其基因组都有至少20,000个的结构变异,这些变异带来的影响或许比SNVs或InDels带来的影响更大。 获得单个或者所有样本的结构变异和基因型,.svsig.gz到.vcf 具体分析命令 数据我们还是使用德系犹太人家系:HG002(子)、HG003(父)、HG004(母),具体参考基因组 - 人类基因组变异分析 参考文献 神灯宝典之PB三代重测序分析实录(一) 神灯宝典之三代重测序分析实录(二) 三代测序时代的临床科研 三代重测序到底能干什么?

    2.1K00编辑于 2023-11-24
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析 (PacBio)(7)-- AnnotSV

    基因组结构变异(structure variant, SV)是基因组变异的重要组成部分,大片段插入(Insertion, INS)、缺失(Deletion, DEL)、倒位(Inversion, INV 第三代基因组测序因其读长较长,可轻松跨越重复区域和基因组复杂区域,能够更全面的检测基因组的SV。 ACMG,全称为American College of Medical Genetics and Genomics美国医学遗传学与基因组学学会。 AnnotSV支持.vcf和.bed作为输入,可以非常方便地集成到各种分析流程中。输出也非常灵活,有TSV、VCF和HTML报告等多种格式。 如果你需要可视化分析,可以使用AnnotSV的前端工具knotAnnotSV,非常好用。

    1.4K10编辑于 2023-12-09
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (4)-- DeepVariant

    我们对下机数据进行比对分析 (pbmm2软件),提取基因组中所有的潜在多态性SNP位点和小片段插入/缺失InDel位点(DeepVariant软件),后期再根据质量值、深度、重复性等因素做进一步的过滤筛选 从测序数据中进行准确的变异检测也是生物学、医学研究和精准医学的基础我们对下机数据进行比对分析 (pbmm2软件),提取基因组中所有的潜在多态性SNP位点和小片段插入/缺失InDel位点(DeepVariant 我们对下机数据进行比对分析,提取基因组中所有的潜在多态性SNP位点和小片段插入/缺失InDel位点,再根据质量值、深度、重复性等因素做进一步的过滤筛选,最终得到高可信度的SNP数据集并注释。 二、变异检测工具目前SNP和INDEL变异检测的软件有很多,比如老牌行业“金标” 由Broad Institute 开发 GATK,即Genome Analysis Toolkit 基因组分析工具。 有了这个结果后,就可以进行后续的分析了。

    2.3K21编辑于 2023-11-12
  • 来自专栏医学数据库百科

    TCGA泛癌基因组分析(PCAWG)介绍

    我们在进行TCGA数据分析的时候,除了可以对单一的癌种进行分析之外。还可以对所有的33种肿瘤进行统一的分析解读,来寻找33种肿瘤当中所存在的共同的特征。这就是我们说到的泛癌分析了。 关于泛癌分析的计划,从2013年就开始了。那个时候就提到了要对TCGA的所有数据来来进行整合的分析。 ? 再往后系统的泛癌分析接下来就是到了今年的PCAWG了。 ? 所谓PCAWG 泛癌基因组分析(Pan-Cancer Analysis of Whole Genomes , PCAWG)是TCGA的相关工作人员,利用TCGA数据当中的WGS(基因组测序)的数据 在数据分析方面,PCAWG Scout可以进行所有其他数据库进行的分析 在数据下载方面,尤其是最原始的BAM数据的下载ICGC数据库是可以的,别的都不行。 ?

    4.3K10发布于 2020-07-23
  • 来自专栏生信小王子

    GWAS | 使用GEMMA进行基因组关联分析

    GEMMA (Genome-wide Efficient Mixed Model Association) 是基于混合模型进行基因组关联分析的工具。 运行速度非常快,结果准确,使用也十分方便,非常适合初学者做GWAS分析。 ? 首先我们要下载和安装GEMMA。 计算好的kinship矩阵在目录下的output文件夹中,接下来就可以进行关联分析了。 ./gemma-0.98.1-linux-static -bfile gemma_input -k .

    10.7K42发布于 2020-08-10
  • 来自专栏小明的数据分析笔记本

    基因组关联分析(GWAS)学习笔记——3.1

    参考资料 https://github.com/MareesAT/GWA_tutorial/ 基因组关联分析学习资料(GWAS tutorial) 论文 A tutorial on conducting

    2.2K20发布于 2020-03-03
  • 来自专栏小明的数据分析笔记本

    基因组关联分析(GWAS)学习笔记——3.2

    书接上文 基因组关联分析(GWAS)学习笔记——3.1 参考资料 https://github.com/MareesAT/GWA_tutorial/ 基因组关联分析学习资料(GWAS tutorial $4, $5, $6, $7, $8, $9, $10, $11, $12, $13}' HapMap_3_r3_13_mds.mds > covar_mds.txt 运行完以上代码就得到了下一步分析需要用到的

    1.7K30发布于 2020-03-03
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (2)-- CCS的使用

    一、基因组 PacBio SMRTbell文库的构建流程 1. 基因组SMRTbell文库构建流程 以基因组HiFi文库为例(10-20Kb文库 ) ,图1左所示: 1)通过核酸提取得到基因组DNA(gDNA)后,先利用G-tube管或Megaruptor System 将基因组片段化至合适大小 (一般动植物基因组20 Kb建库,微生物基因组10 Kb建库); 2)通过去除单链悬突、损伤修复和末端修复等步骤,得到完整的双链DNA插入片段; 3)通过将SMRTbell接头连接至双链 CLR模式适用超长片段文库(> 25 kb),对下机的subreads数据不再进行后续处理,可以直接使用,用作下游分析的原始数据,唯一的缺点就是每条reads准确度低一些。 并且服务器配置SMRTlink软件的用户,可以直接在SMRTlink中运行CCS(Circular Consensus Sequencing)程序,运行完成以后,你还会在SMRTlink里面得到CCS分析报告

    4.8K31编辑于 2023-10-26
  • 来自专栏三代测序-说

    基因组 - 人类基因组变异分析(PacBio) (3)-- pbmm2

    BWA-MEM 是一种新的比对算法,用于将测序 reads 或者组装后 contigs 比对至大型参考基因组,例如人参考基因组。 1.参考基因组的获取 分析前,除测序数据外,我们还需准备对应物种的参考基因组fasta文件。对此可以根据自己研究的需要,在NCBI、Ensembl、UCSC等常见数据库中进行下载。 公共数据演示: (1) 从gencode数据库下载人类参考基因组, 进行pbmm2索引。 PacBio推荐人类参考基因组(详细参照李恒博客),所以采用推荐基因组进行后续分析。 重测序数据分析(短序列的比对算法SNP/indel 和CNV/SV calling 方法) 2.  神灯宝典之PB三代重测序分析实录(一) 你可能不知道的基因组注释文件冷知识 超精华生信ID总结,想踏入生信大门的你-值得拥有

    2.2K50编辑于 2023-11-23
  • 来自专栏小明的数据分析笔记本

    R语言rMVP包做GWAS(基因组关联分析分析实例

    植物里做GWAS分析通常是选择某个群体做二代基因组测序(有的已经研究比较多的物种比如 水稻、玉米可以能已经发表过很多数据,),测序数据与参考基因组进行比对鉴定变异位点,然后用变异位点和表型特征去做关联分析

    3.4K21编辑于 2024-05-18
  • Sentieon | 野草莓(Fragaria vesca)基因组WGS分析流程

    今天给大家介绍的是基于 Sentieon 软件开发的用于野草莓(Fragaria vesca)基因组测序数据的自动化流程脚本。 测试野草莓样本测序深度82.91X,从FASTQ到VCF流程分析最快用时8.15分钟,大幅压缩了植物群体基因组分析时间,加快科研成果转化。 脚本应用示例使用上述脚本对野草莓基因组测序数据分析的测序结果,具体样本信息如下表所示:类别详情物种IDFragaria vesca物种名和倍性野草莓(二倍体)参考基因组GCF_000184155.1_ 1.0_genomic.fna.gz测试硬件配置CPU为单颗AmpereOne A192-32X内存为512GB DDR5系统为Ubuntu 24.04/Kernel 6.8测试结果使用本文流程对野草莓基因组测序数据进行变异检测分析 从FastQ到VCF流程分析最快用时8.15分钟,大幅压缩了植物群体基因组分析时间,加快科研成果转化。Sentieon在不断地优化算法的运行效率,为科研工作者提供更快速、更经济的基因检测方案。

    17510编辑于 2026-01-07
  • 来自专栏实验盒

    GWAS_Flow:使用GPU加速基因组关联分析

    很多分析工具在开发时并没有考虑到大规模数据的应用场景。在数据量不大的时候,这些工具的计算时间并不会太长,可以让人接受。但在数据规模庞大时,可能就 hold 不住,等待时间让人发指。 加速大规模生物数据的分析速度有很多方法,其中利用 GPU 加速基因组研究是一个非常火的方向。

    1.2K20发布于 2021-09-22
  • 来自专栏生信技能树

    基于基因组的基因家族分析(1):数据准备

    1.基因组下载网站介绍 Sol Genomics Net:茄科基因组网络,里面包括了很多物种的基因组测序结果:番茄,土豆,茄子等。 而且基因组更新最快,搜索了一下发现NCBI番茄基因组和Phytozome番茄基因组为ITAG2.4,而SGN已经是最新版本的ITAG3.2,当然以前的版本也都存在,特别方便。 而且在后面分析基因家族的时候,会出现家族数量相差比较大,可能有10个左右的差距,新版本的基因会多。 SGN完整版基因组 2.序列相关文件下载 基础文件一般我们下载4个:CDS.fa、Protein.fa、GFF.gff3和Genome.fa # 小编在home目录下新建sra目录,所有数据都放在这个目录里面 cd ~/sra # 基因组CDS序列下载 wget ftp://ftp.solgenomics.net/tomato_genome/annotation/ITAG3.2_release/ITAG3.2

    4.1K30发布于 2019-05-13
领券