首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据文摘

    谷歌推人类基因组保存服务

    例如,马萨诸塞州的剑桥伯德研究所(Broad Institute in Cambridge)称,在今年10月,他们相当于每32分钟解码一个人类基因组,所产生的原始数据高达200TB。 目前一个人类基因组在解码之后的原始数据大小在100GB左右,不过该数据还可压缩至1GB以下,谷歌对此类数据的云端储存价格仅为每年0.25美元。

    68560发布于 2018-05-23
  • 来自专栏生信修炼手册

    HapMap-人类基因组单倍型图谱

    在2001年的时候,HapMap联盟发起了HapMap 计划,旨在构建人类基因组的单倍体图谱,由多个国家和组织的科研人员合作完成。 通过大量样本构建高密度的SNP图谱,可以得到更为可靠的关联分析结果,为人类的分子遗传机制和疾病相关研究选提供了数据基础,对于人类基因组的研究具有里程碑式的意义,开启了群体遗传研究的新纪元。

    1.8K20发布于 2020-05-11
  • 来自专栏生信修炼手册

    DGV:人类基因组结构变异数据库

    大部分集中在1-10kb左右,该数据库作为一个正常样本CNV的对照数据集,在进行疾病相关的CNV研究时,可以将与该数据库中重叠的CNV去除,研究剩余的疾病患者特异性的CNV。

    5.4K10发布于 2019-12-19
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) (1)

    破解人类基因密码的三代测序技术: 2022 年 4 月 1 日,赶在愚人节当天,《科学》杂志(Science)刊登系列文章,发表了国际 T2T 联盟攻克的首个人类基因组完成图(CHM13-T2T)研究成果 ,填补了此前几十年人类基因组研究留下的空白:大约 8% 的人类基因组序列「黑洞」,这些区域因为序列复杂性,一直无法被破译,尽管 2003 年国际人类基因组计划(HGP)曾经号称已经「完成了」人类基因组图谱绘制的工作 图片 而在这项宏伟的计划背后,以 PacBio、ONT 为代表的第三代基因测序技术,以及同时发展起来的三代测序生物信息学技术,也走入人们的视野,作为破解人类基因组奥秘的最新武器,其在解决人类遗传性疾病、 本次以人类基因组重测序变异分析为引,先分享PacBio的分析流程,然后是ONT平台的分析流程,还会加入串联重复序列,染色体分型,拷贝数变异,融合基因以及基因组甲基化修饰的分析。 先放一张PacBio人类基因组变异分析的流程图,我们会根据流程图的顺序讲解每个软件的具体使用方法,最后串联成 pipeline 进行数据的批量分析,我们下节见! 图片

    82250编辑于 2023-10-19
  • 来自专栏碱基矿工

    人类基因组时代的泛基因组学

    ----/ START /---- 今天想分享一个主题:人类基因组时代的泛基因组学。 我们熟知的 “人类基因组计划(HGP)” 测序得到的基因组序列其实只是人类这个物种少量个体的基因组序列,我们将它称之为“人类基因组参考序列”,它由若干个高加索人的基因组序列合并而成。 以人类基因组学研究为例,通常情况下我们要将新测序的人类基因组数据和参考基因组进行比对,才能够获得个体、人群之间所存在的序列差异,然后再进行后续研究,比如寻找疾病的遗传起源、肿瘤的易感因子、药物开发的靶点 人类泛基因组的构建 我们应该注意到自 2015 年以来,大规模的人类基因组项目变多了(图3)。 不过,在以上项目中,千人基因组项目无疑是最早开展的大型全球性人类基因组测序计划,它分为三期,从2009年开始,一共测序了世界上26个不同的群体、2504个人的基因组,它所产出的人类基因组变异数据库也是目前最成熟和用的最广的一个

    1.3K20发布于 2020-09-29
  • 来自专栏简说基因

    人类基因组计划发现的8大真相

    人类基因组计划是科学史上重要的里程碑事情。该计划的成功,不仅开启了人类了解自身的旅程,而且成为了国际科技合作的典范。对于人类基因组,发现了以下 8 个事实。 1. 超过 98%的人类基因组不编码蛋白质。 人类基因组中频繁发生片段扩增,尤其在中心体周围(pericentromeric)和端粒下区(subtelomeric)。人类基因组上的片段扩增比酵母、果蝇或是线虫基因组更为普遍。 人类基因组上基因扩增的发生有三种主要的方式。 人类基因组中有数十万个 Alu 重复,曾被认为是偶然杂乱复制的典型元件。但是,这些元件的分布并不是随机的:它们保留在 GC 含量高的区域。因此,可能对人类基因组有某些益处。 7.

    66110编辑于 2024-01-29
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析 (PacBio)(7)-- AnnotSV

    基因组结构变异(structure variant, SV)是基因组变异的重要组成部分,大片段插入(Insertion, INS)、缺失(Deletion, DEL)、倒位(Inversion, INV)、易位(Translocation)、重复(Duplication, DUP)等类型的变异。第三代基因组测序因其读长较长,可轻松跨越重复区域和基因组复杂区域,能够更全面的检测基因组的SV。结构变异往往会对基因结构和表达产生更大的影响,在遗传病和肿瘤的发生发展中扮演了重要角色,因此发现和正确注释结构变异对于疾病的诊断有着至关重要的意义。

    1.4K10编辑于 2023-12-09
  • 来自专栏实验盒

    Methods|Nucleotide Transformer:人类基因组大模型新突破

    多样化的训练数据 为了实现模型的泛化能力,研究团队整合了多种高质量基因组数据: 人类基因组数据:包括完整的人类参考基因组和“千人基因组计划”中的3202个多样化人类基因组,捕捉自然遗传变异。 模型压缩与优化(NT-v2) 通过引入旋转位置编码(RoPE)和SwIGLU激活函数,研究团队成功将模型压缩至原始规模的1/10甚至1/50。

    1K10编辑于 2025-02-08
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) (4)-- DeepVariant

    使用官方推荐安装方式pull docker镜像#指定DeepVariant版本,这次安装为最新版本v1.6.0, 2023年10月24日发布。 # --regions "chr20:10,000,000-10,010,000" 可以指定变异检测范围HG002_1,HG003,HG004实际样本运行:#HG002_1$ nohup docker 对于大规模群体/队列而言(主要针对人类基因组开发),是个非常好的工具(5)。Deepvariant 和 Clara Parabricks 都推荐它来做联合变异(5)。

    2.3K21编辑于 2023-11-12
  • 来自专栏DrugOne

    DeepMind 推出 AlphaGenome:打开人类基因组“暗物质”的 AI 钥匙

    6月25日,Google DeepMind 团队在预印本平台发布了其最新人工智能模型 AlphaGenome,该模型有望成为解读人类基因组“暗物质”的关键工具。 一次性解决多个基因功能预测任务 AlphaGenome 是首个能够处理整个人类基因组并预测 DNA → RNA → 蛋白质表达级联效应的 AI 模型。 局限性与未来展望 尽管成果显著,AlphaGenome 仍存在一定限制: 当前训练数据仅来自人类和小鼠,泛化到其他物种尚未验证; 对距离基因超过10万碱基的远程调控效应预测能力仍不足; 缺乏对动态细胞状态

    52010编辑于 2025-06-28
  • 来自专栏DrugOne

    Nature | 人类基因组数据库帮助识别疾病变异

    科研人员为一个名为gnomAD的人类基因组数据库进行了扩展,现在包含了76,156个完整的基因组序列。这个扩展版的数据库使得科学家能够研究基因组中非编码蛋白质区域的变异是如何影响人类健康的。 在《自然》杂志上,Chen等人提出了一个工具,用于分析大量人类基因组,以识别在突变时最有可能导致疾病的非编码区域。 为了包含人类基因组的非编码部分,越来越多的努力被投入到扩展不耐受度量指标上。Chen等人使用他们称为Gnocchi的方法,为这些工具增添了新的一项功能(图1)。

    55910编辑于 2023-12-26
  • 来自专栏HUBU生信

    Hisat2官网上人类基因组索引的下载

    与大多数比对软件一样,在进行比对前需要先建立参考基因组的索引,遇到比较大的参考基因组时如人类基因组,建立索引可能要耗费很长时间。 但是Hisat2为我们考虑到了这一步,在其官网上有现成的人类基因组的索引文件,我们只需将索引文件下载下来便可开始比对 如 下载GRch38的基因组索引 wget ftp://ftp.ccb.jhu.edu wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/grch37.tar.gz 下载好将文件解压便可开始比对,节省了很多时间 万不要傻乎乎的先去下载人类基因组

    3.9K20发布于 2018-12-27
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) (5)-- pbsv

    通过三代测序技术,在人类基因组中发现了数万个结构变异,而这些变异通常无法通过二代测序技术进行识别(图2)。 4.PAV,Phased Assembly Variant Caller,文章于2021年发表于Science (11),github更新到2023年10月13号(version 2.3.4)。 获得单个或者所有样本的结构变异和基因型,.svsig.gz到.vcf 具体分析命令 数据我们还是使用德系犹太人家系:HG002(子)、HG003(父)、HG004(母),具体参考全基因组 - 人类基因组变异分析 --hifi,--ccs Use options optimized for HiFi reads: -S 0 -P 10. cluster-min-basepair-perc-id INT Do not cluster signatures with basepair identity < P%. [10

    2.1K00编辑于 2023-11-24
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析 (PacBio)(6)-- ANNOVAR

    ANNOVAR是由王凯老师编写的一款用于SNP等变异位点注释的软件 (2),在注释软件(Annovar, SnpEff, VEP-Variant Effect Predictor)中相对引用较高。ANNOVAR能够利用最新的数据来分析各种基因组中的遗传变异。 给定一个包含染色体,起点,终点,参考核苷酸与检测核苷酸序列, ANNOVAR可以进行如下的功能注释:

    1.7K21编辑于 2023-12-07
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) (2)-- CCS的使用

    基因组SMRTbell文库构建流程 以基因组HiFi文库为例(10-20Kb文库 ) ,图1左所示: 1)通过核酸提取得到基因组DNA(gDNA)后,先利用G-tube管或Megaruptor System 将基因组片段化至合适大小 (一般动植物基因组20 Kb建库,微生物基因组10 Kb建库); 2)通过去除单链悬突、损伤修复和末端修复等步骤,得到完整的双链DNA插入片段; 3)通过将SMRTbell接头连接至双链 HiFi reads(High Fidelity reads)是2019年由PacBio推出的基于环化共有序列(Circular Consensus Sequencing,CCS)模式产生的既兼顾长读长(~10 --min-length 最小reads长度,默认为10. --max-length 最大reads长度,默认为50000. ] Draft Filter Options: --min-length INT Minimum draft length before polishing. [10

    4.8K31编辑于 2023-10-26
  • 来自专栏量子位

    人类基因组最后一块拼图完成!Science罕见6篇连发

    梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 人类基因组测序迎来新的里程碑! 首个完整无间隙人类基因组测序,由近百位科学家合作完成,填补上最后8%的空缺。 回看2003年,人类基因组计划 (Human Genome Project)首次完成92%的人类基因测序,创造了历史。 联盟发起人之一、马里兰大学的Adam Phillippy认为,个人基因组测序在10年内有望普及,个性化医疗成本会大幅下降。 攻克最后的8% 当初的人类基因组计划由6国近2000位科学家耗时13年完成,最后遗留的8%靠当时的测序技术难以突破。 原因有二: 其一,最后的8%里有很多片段是重复的。 科学家们用拼图来形容这一困难。 人类基因组计划前负责人Robert Waterston对新方法评价到: (人类基因组)不再有任何隐藏的或未知的部分。

    50220编辑于 2022-04-01
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) (3)-- pbmm2

    Alignment modes of --preset: SUBREAD : -k 19 -w 10 CCS or HiFi : -k 19 -w 10 -u ISOSEQ Example Datasets 如图6所示:下载示例人类基因组数据。 德系犹太人家系:HG002(子)、HG003(父)、HG004(母),属于个人基因组计划中的样本。

    2.2K50编辑于 2023-11-23
  • 来自专栏优雅R

    生信爱好者周刊(第 24 期):从有隙到无间,首个人类完整基因组发布

    「生信周刊讨论区(语雀)」[2] 封面图 Science人类基因组特刊[3] 本周话题:从有隙到无间,首个人类完整基因组发布 人类基因组计划 (HGP) 被誉为历史上最伟大的科学成就之一。 该项目的目标是发现和绘制人类基因组的完整蓝图,包括估计的约25,000个基因,以促进进一步的生物医学研究。 HGP项目于1990年正式启动,在花费10年时间后,也就是在2000年,第一版人类基因组首次发布。 在随后的20年中,虽然科学家们不断使用新的技术填补了一些空白,但直到2020年,仍然有8%左右的人类基因组序列未被绘制出来。 生信科技动态 1、美国All of Us项目发布首批人群队列数据 近日,美国“All of Us”研究项目公布了第一批近10万人的全基因组测序数据,同时包括身高、体重和血压等身体相关数据,以及调查数据

    49420编辑于 2022-04-28
  • 来自专栏生信宝典

    大多数人都不知道,人类基因组正在衰败

    早在70年前,科学家就注意到人类基因组正在不断累积基因突变,而其中大部分突变是有害的。以人类的低生育率要如何破解这个难题?许多科学家们为人类的未来感到十分忧虑。 Sanford 指出,“学遗传学的人都知道,人类基因组累积了越来越多的有害突变,突变载量太大。 人类基因组衰落的症状 ? 人类基因组的衰变已经有了具体的症状。 2017年,发表在《美国国家科学院院刊》上的另一项研究发现,在过去的80年里,爱学习的基因衰落了。 他们还估计,平均每10年,冰岛人的IQ就会下降0.3分(IQ均值为100,大多数人的IQ在70-130之间)。 这不仅仅是冰岛一个国家的问题。 美国国家人类基因组研究所的公共联合研究项目DNA元件百科全书(ENCODE)指出,人类基因组的80%都具有功能。 ?

    87830发布于 2019-12-10
  • 来自专栏三代测序-说

    全基因组 - 人类基因组变异分析(PacBio) -- minimap2 + Sniffles2

    首先从github官网上下载minimap2的二进制文件压缩包,minimap2-2.26_x64-linux.tar.bz2,然后上传到服务器上。

    2.7K10编辑于 2023-11-26
领券