首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) (5)-- pbsv

    通过三代测序技术,在人类基因组中发现了数万个结构变异,而这些变异通常无法通过二代测序技术进行识别(图2)。 从Medhat Mahmoud等人 (5) 的研究中可以看出(图3B),在人类中,三代长度长测序比二代短读长测序在结构变异检测数量上平均高2-4倍。 从文章中的数据看来,DeBreak 在模拟数据(图5)和实测数据HG002(图6)中recall, precision和 F1 score上优于同类软件。 5.PBSV,PacBio官方开发的结构变异软件,github上更新至2023年3月14日(version 2.9.0)。 获得单个或者所有样本的结构变异和基因型,.svsig.gz到.vcf 具体分析命令 数据我们还是使用德系犹太人家系:HG002(子)、HG003(父)、HG004(母),具体参考全基因组 - 人类基因组变异分析

    2.1K00编辑于 2023-11-24
  • 来自专栏大数据文摘

    谷歌推人类基因组保存服务

    例如,马萨诸塞州的剑桥伯德研究所(Broad Institute in Cambridge)称,在今年10月,他们相当于每32分钟解码一个人类基因组,所产生的原始数据高达200TB。 目前一个人类基因组在解码之后的原始数据大小在100GB左右,不过该数据还可压缩至1GB以下,谷歌对此类数据的云端储存价格仅为每年0.25美元。

    68560发布于 2018-05-23
  • 来自专栏生信修炼手册

    HapMap-人类基因组单倍型图谱

    在2001年的时候,HapMap联盟发起了HapMap 计划,旨在构建人类基因组的单倍体图谱,由多个国家和组织的科研人员合作完成。 通过大量样本构建高密度的SNP图谱,可以得到更为可靠的关联分析结果,为人类的分子遗传机制和疾病相关研究选提供了数据基础,对于人类基因组的研究具有里程碑式的意义,开启了群体遗传研究的新纪元。

    1.8K20发布于 2020-05-11
  • 来自专栏生信修炼手册

    DGV:人类基因组结构变异数据库

    DGV数据库收录了健康样本中大于50bp以上的基因组结构变化信息,对应的文章发表在Nucleic Acids Research上,链接如下

    5.4K10发布于 2019-12-19
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) (1)

    破解人类基因密码的三代测序技术: 2022 年 4 月 1 日,赶在愚人节当天,《科学》杂志(Science)刊登系列文章,发表了国际 T2T 联盟攻克的首个人类基因组完成图(CHM13-T2T)研究成果 ,填补了此前几十年人类基因组研究留下的空白:大约 8% 的人类基因组序列「黑洞」,这些区域因为序列复杂性,一直无法被破译,尽管 2003 年国际人类基因组计划(HGP)曾经号称已经「完成了」人类基因组图谱绘制的工作 图片 而在这项宏伟的计划背后,以 PacBio、ONT 为代表的第三代基因测序技术,以及同时发展起来的三代测序生物信息学技术,也走入人们的视野,作为破解人类基因组奥秘的最新武器,其在解决人类遗传性疾病、 本次以人类基因组重测序变异分析为引,先分享PacBio的分析流程,然后是ONT平台的分析流程,还会加入串联重复序列,染色体分型,拷贝数变异,融合基因以及基因组甲基化修饰的分析。 先放一张PacBio人类基因组变异分析的流程图,我们会根据流程图的顺序讲解每个软件的具体使用方法,最后串联成 pipeline 进行数据的批量分析,我们下节见! 图片

    82250编辑于 2023-10-19
  • 来自专栏碱基矿工

    人类基因组时代的泛基因组学

    ----/ START /---- 今天想分享一个主题:人类基因组时代的泛基因组学。 我们熟知的 “人类基因组计划(HGP)” 测序得到的基因组序列其实只是人类这个物种少量个体的基因组序列,我们将它称之为“人类基因组参考序列”,它由若干个高加索人的基因组序列合并而成。 以人类基因组学研究为例,通常情况下我们要将新测序的人类基因组数据和参考基因组进行比对,才能够获得个体、人群之间所存在的序列差异,然后再进行后续研究,比如寻找疾病的遗传起源、肿瘤的易感因子、药物开发的靶点 首先,它很容易产生更多的歧义比对结果(如下图5)。 ? 图5. 歧义比对 在图5中,本来测序 read 只会比对在一个地方的,但现在却会同时比对到图中三个不同的分支序列上,而且由于发生差异的情况都是相同的,这就导致这个 read 在这三个位置上看起来都是合理的,从而形成了歧义

    1.3K20发布于 2020-09-29
  • 来自专栏简说基因

    人类基因组计划发现的8大真相

    人类基因组计划是科学史上重要的里程碑事情。该计划的成功,不仅开启了人类了解自身的旅程,而且成为了国际科技合作的典范。对于人类基因组,发现了以下 8 个事实。 1. 超过 98%的人类基因组不编码蛋白质。 5. 人类基因组中频繁发生片段扩增,尤其在中心体周围(pericentromeric)和端粒下区(subtelomeric)。人类基因组上的片段扩增比酵母、果蝇或是线虫基因组更为普遍。 人类基因组上基因扩增的发生有三种主要的方式。 人类基因组中有数十万个 Alu 重复,曾被认为是偶然杂乱复制的典型元件。但是,这些元件的分布并不是随机的:它们保留在 GC 含量高的区域。因此,可能对人类基因组有某些益处。 7.

    66110编辑于 2024-01-29
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析 (PacBio)(7)-- AnnotSV

    AnnotSV还集成了一个结构变异致病性评级系统,参考ACMG标准给出1-5级的评分,可以帮助遗传学家和临床医生评估遗传变异的临床意义,快速定位最有可能致病的结构变异,帮助他们做出更准确的诊断和治疗决策

    1.4K10编辑于 2023-12-09
  • 来自专栏实验盒

    Methods|Nucleotide Transformer:人类基因组大模型新突破

    多样化的训练数据 为了实现模型的泛化能力,研究团队整合了多种高质量基因组数据: 人类基因组数据:包括完整的人类参考基因组和“千人基因组计划”中的3202个多样化人类基因组,捕捉自然遗传变异。

    1K10编辑于 2025-02-08
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) (4)-- DeepVariant

    PrecisionFDA的Truth Challenge比赛中,DeepVariant获得了最高SNP性能奖,PacBio +DeepVariant(Highest SNP Performance)(图5) GLnexus是由DNAnexus开发,用于可扩展的gVCF合并和联合变异(joint calling)要求群体测序项目,GL即genotype likelihood之意(5)。 而这正是整个GATK流程的最限速的步骤,在GATK中只能通过分区的方法来加速,效果非常有限(5)。GLnexus的开发解决了这个痛点问题,在速度上不说几十上百倍的提升,至少也有十多倍。 对于大规模群体/队列而言(主要针对人类基因组开发),是个非常好的工具(5)。Deepvariant 和 Clara Parabricks 都推荐它来做联合变异(5)。

    2.3K21编辑于 2023-11-12
  • 来自专栏DrugOne

    DeepMind 推出 AlphaGenome:打开人类基因组“暗物质”的 AI 钥匙

    6月25日,Google DeepMind 团队在预印本平台发布了其最新人工智能模型 AlphaGenome,该模型有望成为解读人类基因组“暗物质”的关键工具。 一次性解决多个基因功能预测任务 AlphaGenome 是首个能够处理整个人类基因组并预测 DNA → RNA → 蛋白质表达级联效应的 AI 模型。

    52010编辑于 2025-06-28
  • 来自专栏DrugOne

    Nature | 人类基因组数据库帮助识别疾病变异

    科研人员为一个名为gnomAD的人类基因组数据库进行了扩展,现在包含了76,156个完整的基因组序列。这个扩展版的数据库使得科学家能够研究基因组中非编码蛋白质区域的变异是如何影响人类健康的。 在《自然》杂志上,Chen等人提出了一个工具,用于分析大量人类基因组,以识别在突变时最有可能导致疾病的非编码区域。 为了包含人类基因组的非编码部分,越来越多的努力被投入到扩展不耐受度量指标上。Chen等人使用他们称为Gnocchi的方法,为这些工具增添了新的一项功能(图1)。

    55910编辑于 2023-12-26
  • 来自专栏HUBU生信

    Hisat2官网上人类基因组索引的下载

    与大多数比对软件一样,在进行比对前需要先建立参考基因组的索引,遇到比较大的参考基因组时如人类基因组,建立索引可能要耗费很长时间。 但是Hisat2为我们考虑到了这一步,在其官网上有现成的人类基因组的索引文件,我们只需将索引文件下载下来便可开始比对 如 下载GRch38的基因组索引 wget ftp://ftp.ccb.jhu.edu wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/grch37.tar.gz 下载好将文件解压便可开始比对,节省了很多时间 万不要傻乎乎的先去下载人类基因组

    3.9K20发布于 2018-12-27
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析 (PacBio)(6)-- ANNOVAR

    ANNOVAR使用.avinput格式,最少需要5列,分别代表染色体(Chromosome),起始位置(Start),终止位置(End),参考等位基因(Reference Allele),替代等位基因( 第4,5列:突变位置。 第6,7列:参考碱基,突变碱基。 intronic 27045 ncRNA_exonic 12 ncRNA_exonic;splicing 444673 ncRNA_intronic 137 ncRNA_splicing 2 ncRNA_UTR5 231 splicing 43983 upstream 1657 upstream;downstream 60864 UTR3 10620 UTR5 27 UTR5;UTR3 refGene.exonic_variant_function 所有外显子变异的信息 (35227+44 = 35271个突变),如图5

    1.7K21编辑于 2023-12-07
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) (2)-- CCS的使用

    3 -j 12 sample.subreads.bam sample.ccs.bam #生成 .fastq.gz 文件 $ ccs --min-rq 0.999 --min-passes 5

    4.8K31编辑于 2023-10-26
  • 来自专栏量子位

    人类基因组最后一块拼图完成!Science罕见6篇连发

    梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 人类基因组测序迎来新的里程碑! 首个完整无间隙人类基因组测序,由近百位科学家合作完成,填补上最后8%的空缺。 回看2003年,人类基因组计划 (Human Genome Project)首次完成92%的人类基因测序,创造了历史。 攻克最后的8% 当初的人类基因组计划由6国近2000位科学家耗时13年完成,最后遗留的8%靠当时的测序技术难以突破。 原因有二: 其一,最后的8%里有很多片段是重复的。 科学家们用拼图来形容这一困难。 人类基因组计划前负责人Robert Waterston对新方法评价到: (人类基因组)不再有任何隐藏的或未知的部分。

    50220编辑于 2022-04-01
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) (3)-- pbmm2

    --preset: SUBREAD : -k 19 -w 10 CCS or HiFi : -k 19 -w 10 -u ISOSEQ : -k 15 -w 5 Alignment modes of --preset: SUBREAD : -k 19 -w 19 -o 5 -O 56 -e 4 -E 1 -A 2 -B 5 -z 400 - -w 19 -u -o 6 -O 26 -e 2 -E 1 -A 1 -B 4 -z 400 -Z 50 -r 2000 -g 5000 ISOSEQ : -k 15 -w 5 -u -o 2 -O 32 -e 1 -E 0 -A 1 -B 2 -z 200 -Z 100 -r 200000 -g 2000 -C 5 -G 200000 UNROLLED : -k Example Datasets 如图6所示:下载示例人类基因组数据。 德系犹太人家系:HG002(子)、HG003(父)、HG004(母),属于个人基因组计划中的样本。

    2.2K50编辑于 2023-11-23
  • 来自专栏生信宝典

    大多数人都不知道,人类基因组正在衰败

    早在70年前,科学家就注意到人类基因组正在不断累积基因突变,而其中大部分突变是有害的。以人类的低生育率要如何破解这个难题?许多科学家们为人类的未来感到十分忧虑。 Sanford 指出,“学遗传学的人都知道,人类基因组累积了越来越多的有害突变,突变载量太大。 人类基因组衰落的症状 ? 人类基因组的衰变已经有了具体的症状。 2017年,发表在《美国国家科学院院刊》上的另一项研究发现,在过去的80年里,爱学习的基因衰落了。 乐观派 当然,虽然大部分科学家承认人类基因组突变量累积的事实,但是一些人对这个现象的后果却比较乐观。他们的主要观点大概是三类。 ? 美国国家人类基因组研究所的公共联合研究项目DNA元件百科全书(ENCODE)指出,人类基因组的80%都具有功能。 ?

    87830发布于 2019-12-10
  • 来自专栏优雅R

    生信爱好者周刊(第 24 期):从有隙到无间,首个人类完整基因组发布

    「生信周刊讨论区(语雀)」[2] 封面图 Science人类基因组特刊[3] 本周话题:从有隙到无间,首个人类完整基因组发布 人类基因组计划 (HGP) 被誉为历史上最伟大的科学成就之一。 该项目的目标是发现和绘制人类基因组的完整蓝图,包括估计的约25,000个基因,以促进进一步的生物医学研究。 HGP项目于1990年正式启动,在花费10年时间后,也就是在2000年,第一版人类基因组首次发布。 工具 1、GitHub action - Hub Mirror Action[5] 一个Github Action,用于在Github和Gitee之间同步代码。 Academic writing in R Markdown I: https://www.marianamontes.me/post/academic-writing-in-r-markdown-i/ [5]

    49420编辑于 2022-04-28
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) -- minimap2 + Sniffles2

    首先从github官网上下载minimap2的二进制文件压缩包,minimap2-2.26_x64-linux.tar.bz2,然后上传到服务器上。

    2.7K10编辑于 2023-11-26
领券