搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏科研猫
单细胞测序系列（1）--单细胞全基因组测序
今天，我们就来说说单细胞测序的整套流程，以单细胞基因组测序为例，主要包括四个步骤：单细胞分离→全基因组扩增→高通量测序→数据分析。 2 单细胞全基因组扩增单细胞全基因组扩增(whole genome amplification,WGA)其原理是通过将单个细胞溶解得到微量基因组DNA进行高效地扩增，获得高覆盖度的单细胞基因组的技术。由于单细胞中DNA的含量非常小（约6pg/细胞），达不到测序仪的检测要求，故在测序前，必须先对单细胞中的DNA进行扩增富集。 3 单细胞全基因组测序全基因组测序是筛查单细胞SNP（单核苷酸多态性）及CNV（拷贝数变异）的有效手段。在基因组中，外显子虽然只占其全长的1%，却包含了约85%疾病相关的变异位点，因此，外显子组测序也十分重要。外显子组测序只对外显子进行富集、扩增，所以其相比全基因组测序能更加高效、更利于编码序列的读取。
6.3K42发布于 2019-09-24
来自专栏生信技能树
全基因组测序的7个概念（学徒翻译）
什么是基因组？ 基因组是生物体的一套完整的遗传信息。基因组包括创造和维持生命的所有遗传指令和繁殖指令。人类基因组和其他细胞生命形式一样由DNA组成，包括核DNA和线粒体DNA。药物基因组学是精确医学的一个组成部分。通过结合药理学和基因组学，药物基因组学研究特定药物对一个人的基因组指纹的影响。全基因组测序是什么？ NCI将人类全基因组测序定义为：一种被用于确定个体完整DNA序列（包括非编码序列）中的几乎全部近30亿核苷酸的的实验室方法。该模块的重点是人类的全基因组测序。全基因组测序原本通过Sanger测序来测序人类基因，这花费了十多年的时间和十多亿美元。现在，我们运用被称为“次代测序”、“大规模平行测序”和“高通量测序”的新技术。这些新技术较传统Sanger测序可以更快更低廉地对DNA、RNA进行测序，通常大约花费几天和一千美元。参阅《肿瘤组织病理学评估》中的“肿瘤学中的常用病理学检查”一节以获取该技术的更多细节。
1.4K20发布于 2019-08-22
基因组测序简介
，我们看到了基因组测序技术在花费成本和时间上的大幅减少。 [5a2b5dr3mk.jpeg] 基因组测序简介 基因组测序就是使用化学方法和记录技术依次（按顺序）读取编码基因组的字符（A，G，C，T）。 [基本组测序的基本流程] 数据最初是以短字符串的形式读取的。对于一个人基因组的30倍覆盖（30倍是一个普遍的目标），可能有大约6亿个长为150个字符的短字符串。 [基因测序技术发展简史] 测序技术一直是加速发展的对象。1998年至2001年，人类进行了第一次基因组测序，以2009年的美元为标准它花费了28亿美元。今天，基因组可以在3天内进行测序，价格大约为1000美元（更多信息，请查阅美国国立卫生研究院：国家人类基因组研究所（NHGRI）> DNA测序成本）。
1.7K50发布于 2018-02-01
来自专栏生信菜鸟团
转移性尿路上皮癌全基因组测序
研究方法：病人和样本：116名计划接受系统性姑息治疗的mUC患者的新鲜转移肿瘤活检样本测序策略：116名患者进行了全基因测序 WGS ，90名患者进行了 RNA测序。数据处理流程：对于WGS ，测序读长是 2*150，数据处理流程是按 Nature 上泛癌全基因组文章的方法来 Pan-cancer whole-genome analyses of metastatic 显着突变的基因与原发性 UC 中报道的相似，但与基因组亚型不对应。研究者整合了基因组和转录组数据，为每个转录组亚型和个体患者提出了潜在的治疗选择。研究结论：该研究首次基于对116名mUC患者的转移活检样本的全基因组和转录组分析，并且分别定义了mUC的分子亚型。
29910编辑于 2024-05-11
来自专栏生信喵实验柴
宏基因组建库测序
宿主污染是影响非常大的因素，尤其是病毒检测，由于同一细胞内，病毒基因组与宿主基因组丰度相差太大。如果全部进行测序，很难测序到病毒的序列。 2.1 如何去除宿主污染宏基因组测序过程中，一些样品往往会包括宿主基因组和一些抑制因子，例如复杂多糖、胆酸盐、脂类和尿酸等，这些都会对测序目标序列造成影响。没有测序到目标序列，无法进行后续数据分析。因此，对于此类宏基因组样品，减少宿主污染非常重要。宏基因组测序同样需要考虑不同测序平台的影响，目前主要有二代测序 illumina，华大DNBseq，三代 pacbio 平台以及纳米孔测序平台。，方便进行快速鉴定2、可以得到 16S 全长；3、宏基因组进行拼接效果较好；缺点 1、读长短，唯一性差2、测序速度慢，不能进行快速鉴定；3、16S 测序无法得到全长；4、不便于宏基因组拼接； 1、价格高
1.4K10编辑于 2023-02-24
来自专栏三代测序-说
全基因组 - 人类基因组变异分析 (PacBio）（6）-- ANNOVAR
如果将个体基因组与参考基因组相比，变异的数量是巨大的。据估计（1），全球范围内人类的基因组中总共有超过8800万个变异（包括约8470万个单核苷酸多态性、360万个短插入/缺失变异和约6万个结构变异）。 ANNOVAR能够利用最新的数据来分析各种基因组中的遗传变异。 refGene.variant_function所有变异的信息（一共6,982,339个变异），如图4。第1列：变异存在位置信息，如intergenic, upstream等。第6，7列：参考碱基，突变碱基。
1.7K21编辑于 2023-12-07
来自专栏新智元
【精度平均最高80%】机器学习+全基因组测序，准确预测人体特征
【新智元导读】人类长寿公司的研究人员最近在PNAS发表了一篇论文，利用全基因组测序数据，使用机器学习方法，预测个体的性状。人类长寿公司的研究人员最近在PNAS发表了一篇论文，利用全基因组测序数据，使用机器学习方法，预测单个人的性状。具体到这项研究，研究人员从1,061名18~82岁、不同种族的被试中抽取基因组测序样本信息。研究人员还采集了3D面部图像、语音样本、身高、体重等数据。研究人员开发了一种名为最大熵的机器学习算法，并表示如果有更多的数据，模型能够得出更好的预测结果（也即将全基因组测序数据与表型和人口统计数据相匹配）。实验中，机器学习算法发现了所有预测模型的组合。为了探索目前基于表型的基因组的鉴定能力，我们应用全基因组测序、详细表型分析和统计建模，预测了不同祖先的1,061名参与者的生物特征。
93940发布于 2018-03-22
来自专栏天意生信俱乐部
基于PacBio HiFi数据的人类全基因组重测序变异分析流程
随着第三代测序技术，特别是PacBio HiFi（High Fidelity）测序技术的发展，我们能够获得兼具长读长和高准确度的测序数据。这为人类全基因组重测序（WGS）分析，尤其是复杂区域和结构性变异（Structural Variation, SV）的检测，带来了革命性的进步。全基因组重测序（WGS）旨在全面检测个体相对于参考基因组的遗传变异，包括单核苷酸变异（SNV）、小片段插入缺失（Indel）和结构性变异（SV）。传统的短读长测序（如Illumina）在检测基因组重复区域和复杂SV方面存在局限性。 6.变异可视化: 使用 IGV 对比对结果和变异位点进行可视化检查。三、详细步骤与软件使用 1.数据生成与预处理 (HiFi Reads Generation) 构建文库后上机测序。
1.5K10编辑于 2025-04-22
来自专栏生信菜鸟团
肿瘤基因组测序数据高级分析--肿瘤基因组测序数据分析专栏
简介大多数肿瘤基因组综述类文章，对于数据分析部分只是介绍了基础分析部分，也就是从原始的 fastq 文件通过质控、比对、GATK流程、Call 变异最后得到 vcf 文件和拷贝数变异的结果就结束了。如果把突变位点的侧翼各 1 bp 的碱基也考虑进来，也就是三连核苷酸突变，就有 4x6x4=96 种碱基突变类型。肿瘤微卫星稳定性分析微卫星(Microsatellite)，基因组中的一类短串联重复DNA序列，一般由1-6个核苷酸组成，呈串联重复排列。由于其核心重复单元重复次数差异，微卫星具有群体多态性。最初TMB通过全外显子测序（WES）进行检测表征，其本质上认为基因突变仅限于外显子（编码区）；后来也有很多文章基于特定 Panel 数据评估 TMB，或者基于 ctDNA 数据评估 bTMB等，原理都一样肿瘤纯度和倍性评估通常来说，对肿瘤组织进行测序，往往是一个混合样品，既包括肿瘤细胞也包括正常细胞，因此需要进行肿瘤纯度 purity 的评估。
4.8K43发布于 2021-10-12
来自专栏新智元
Science封面6连发：人类最完整的基因组测序完成！
Science连发6篇封面文章，宣布人类完整基因组测序计划正式完成。算起来，距离人类最早讨论基因组测序计划，到今天已经过去了近40年。 1999年，中国科学院遗传研究所人类基因组中心向NIH国际人类基因组计划（HGP）递交加入申请，承担总测序量1%（约3000万对碱基）的测序任务。 2003年4月，人类基因组计划宣布完成。但这里的「完成」要打个折扣，因为这个计划无法对所有人类细胞中发现的DNA进行测序，只能对基因组的「真染色质」区域进行测序，这些区域占人类基因组的92%。全基因组测序变成「完形填空」 2001年，人类基因组的第一份草案提出开始时，甚至在首次宣布「完成」后，基因测序技术都无法涉足DNA序列包含非常重复的碱基段的区域。
49230编辑于 2022-04-02
来自专栏百味科研芝士
单基因结合全基因组发6分SCI
文章主要是研究h-prune这个基因在肝细胞癌（HCC）中的临床意义及潜在调控机制，从全基因组层次对h-prune基因进行全面研究。结果显示肝癌组织中h-prune的表达量高于邻近的正常组织（图A），Western blot检测了6例人肝癌组织和配对正常组织中h-prune的表达，发现在肝癌组织中h-prune显著上调（图B）。 2.3 h-prune高表达与低表达患者突变及CNV分析 h-prune高表达的肿瘤在RPS6KA3中具有更高的突变频率（图A），已有文章证明RPS6KA3参与了细胞增殖过程。这表明，与RPS6KA3和RB1突变相关的功能可能会被激活，这将有助于h-prune的过度表达。而图B表明不论h-prune的表达量如何，大部分细胞的染色体都发生了显著的扩增或缺失。结语本文以h-prune基因为中心，从全基因组层次研究其在肝细胞癌中的潜在调控机制。利用华西医院的304例临床样本研究h-prune基因与预后的关系，数据充分且准确，流程规范且全面。
77011发布于 2020-03-04
来自专栏小明的数据分析笔记本
大肠杆菌全基因组重测序变异检测小实例（侧重变异过滤）
本文偏重对vcf文件的探索以及设置过滤标准原文地址 Filtering and handling VCFs fastq测序获取数据未找到原文所用数据，本文使用GATK4.0和全基因组数据分析实践（上）文章中的大肠杆菌基因组作为参考序列，使用wgsim软件模拟生成双端150bp测序数据 wgsim -N 80000 -1 150 -2 150 .. fastq -N指定生成reads的条数 -1 -2生成reads的长度接下来是参考序列接下来是fastq文件的名字使用samtools变异检测获取vcf文件这一部分参考文章 GATK4.0和全基因组数据分析实践 image.png 这部分的解释自己还没有太看懂，留待后续分解根据位点质量值和测序深度过滤我们的vcf文件 vcftools --vcf ..
2.1K10发布于 2020-03-03
来自专栏生信喵实验柴
二代测序基因组拼接实战
其中两株细菌已包含发表出来的全基因组序列。通常只要给软件输入测序的数据，即可拼接出很好的全基因组。影响基因组拼接的因素很多，包括内在因素来自基因组本身的重复序列，多倍体杂合，还包括外在因素测序错误，测序饱和度等。 1、重复序列是基因组拼接最大的影响因素。 6、覆盖深度：测序深度不足或者不均匀，会影响软件判断重复序列区域； 7、随机性：测序 reads 之间需要更多的 overlap 连接，随机性不好，或者 DNA 降解会造成过多的如果发现测序拼接得到的基因组中有污染，很难通过生物信息的方法完全进行拆分，建议重新取样测序。写在最后：有时间我们会努力更新的。
3.4K40编辑于 2022-05-23
来自专栏生信喵实验柴
二代测序宏基因组拼接
由于基因组本身具有的高度重复序列，多倍体杂合位点，低复杂度区域以及测序错误等诸多条件的影响，基因组拼接一直是一项非常复杂且困难的工作。尤其是基因组重复序列的影响，一直是二代短读长测序最难解决的问题，尽管后来基于二代测序数据开发除了一些辅助拼接方案，例如大片段文库，Optical mapping光学图谱，三位基因组等辅助方案，都无法彻底解决基因组拼接难题而利用 nanopore 长度长测序，将革命性地解决重复序列对于基因组拼接的影响。纳米孔测序的宏基因组拼接，由于测序长度更长，可以直接拼接出一些细菌完整的基因组序列，而这些细菌往往无法通过传统纯培养的方法获得，这为获得无法纯培养样品得到完整基因组序列提供了新思路。影响基因组拼接的因素很多，包括内在因素来自基因组本身的重复序列，多倍体杂合，还包括外在因素测序错误，测序饱和度等。
1.6K10编辑于 2023-02-24
来自专栏简说基因
短讯 | 利用开源 Galaxy 平台简化临床细菌全基因组测序数据分析
本文介绍了开源的 Galaxy 平台在简化临床微生物全基因组测序数据分析方面的作用。我们认为，该平台将有助于快速且低成本地进行细菌全基因组测序数据分析，尤其适用于资源有限的环境。引言下一代测序（NGS）降低了测序成本并显著提高了测序通量，使得在数小时内对细菌病原体全基因组进行常规测序成为可能，并能获得对获得性抗菌药物耐药性基因相当全面的分析结果 [7,8]。讨论尽管下一代测序已彻底改变了医学和诊断学的许多方面，但全基因组测序在常规临床微生物学中的应用仍通常局限于参考中心、罕见耐药机制的鉴定、研究目的或回顾性流行病学监测。 Galaxy 平台便于缺乏高级生物信息学技能的临床微生物学家进行细菌全基因组测序数据分析。其使用可促进全基因组测序方法在许多临床微生物学环境中的应用，成本低且无需大量培训。
31610编辑于 2025-11-24
来自专栏科研猫
69 种基于全基因组测序数据分析结构变异的算法评估
在今年的 6 月份，基因组学领域的权威期刊Genome Biology发表了一篇方法学评估类文章，在这篇文章中作者系统地分类和评估了目前主要的69种基于全基因组测序（whole genome sequencing 导言如果你已经听说过中国的10万人基因组计划和UK Biobank的50 万人基因组计划就会知道，未来是最不缺全基因组测序数据的。我个人一直相信全基因组测序会在不久的将来成为疾病/药物研究、表型关联分析等领域的首选测序技术。哪怕是截止现在，单单在美国 St. Jude 儿童研究医院的云计算平台就已经托管了超过 11000 例全基因组测序数据样本。我不知道在国内现在是怎样的一番情况。全基因组测序技术是目前最常见、最具应用前景的高通量测序技术之一。 Ann Hum Biol. 2013 Nov-Dec;40(6):463-71. doi: 10.3109⁄03014460.2013.807878.
2.6K10发布于 2019-10-28
来自专栏生信星球学习小组第169期
day6-测序知识
1.测序过程文章《测序的世界》：https://www.jianshu.com/p/101c14c3a1d2DNA测序：一代测序（Sanger测序）a.多聚核糖核苷酸链的降解法，磷酸单酯酶的脱磷酸作用和高碘酸盐的氧化作用从链末端逐一分离寡核糖核苷酸并测定其种类 b.双脱氧核苷酸ddNTPc.1983年的Kary Mullis 发明PCR测序仪二代测序：Roche公司的454技术、illumina公司的Solexa/Hiseq技术和ABI公司的SOLID技术标志第二代测序技术诞生介绍 Hiseq Pair End双端测序原理数据分析登入切换账号ssh bio05@ip下载安装直接在服务器中wget https://www.bioinformatics.babraham.ac.uk 卡在这里了--> cd FastQC -- > chmod755 fastqc我们换一种方法：下载filezilla导入linux服务器 2.测序类型生信小白第6天-初涉测序 (qq.com)DNA 测序技术的发展：第三代测序法 (qq.com) 【陈巍学基因】参考生信星球学习小组第169期 (umu.cn)
26300编辑于 2024-05-13
来自专栏医学数据库百科
GENIE | 大型肿瘤基因组测序数据集
#TCGA]] 但是除了 TCGA 之外，还有很多公共的有组织的大型测序数据集。其中就包括了，我们之前介绍的 [[MSKCC-肿瘤相关基因组检测公共数据库介绍]] 的数据。和 TCGA 不同的是，目前的 GENIE 主要包括的还是基因组测序的数据。目前这个版本包括了超过 111, 000 名患者的近 120, 000 个测序样本。但是也由于这个数据集主要还是分析基因肿瘤基因组的变化，另外相对应的临床信息也少一些。所以基本的一些研究也是集中于肿瘤特征性的突变研究上。其他数据集介绍测序数据集 [[Met500-肿瘤转移数据集介绍]] [[MSKCC-肿瘤相关基因组检测公共数据库介绍]] [[ENCODE-转录调控必知数据库]] 流调数据集 [[HINTS-美国健康信息趋势调查数据集
2K10编辑于 2022-04-01
来自专栏科研猫
二代测序的基因组数据分析入门（illumina测序原理篇）
一代测序第一代测序是由生物化学家桑格（Frederick Sanger）发明的，因此被称为桑格法测序，也被称为“双脱氧测序”。为什么称为“双脱氧测序”呢，这主要是基于它的测序原理。二代测序第二代高通量测序也称为下一代测序技术，相比于第一代测序通量更高、速度更快、成本更低，主要有样本制备、文库构建、测序反应等过程。下面正式开始建库： 1、首先把基因组DNA用超声波打断； 2、打断之后会出现末端不平整的情况，所以我们先要将它补齐成平末端； 3、补平之后要在3’端使用klenow酶加上一个特异性碱基A； 4、加上A之后就可以用连接酶加上特异性接头； 5、连好了接头的DNA混合物我们就称为DNA文库； 6、然后进行PCR扩增，以保证我们的DNA样品浓度能够达到上机的要求。 6-8个碱基，然后就可以知道这一段DNA来自哪个样本。
16.2K514发布于 2019-10-28
来自专栏有困难要上，没有困难创造困难也要上！
使用SPAdes测序数据拼接软件拼装基因组
Petersburg Academic University 与美国科学家合作开发的主要应用于小型基因组如细菌，真菌等基因组测序数据的拼接软件。目前的最新版本 v3.6.2 可以支持常见的 illumina miseq/hiseq 和 ion torrent 测序数据，对单分子测序平台的 pacbio 和 nanopore 的测序数据也能进行拼装 -it --rm -v `pwd`:/spades quay.io/biocontainers/spades:3.12.0--1 bash # 运行一下测试 spades.py --test 拼装基因组
2.3K10发布于 2019-03-20

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

单细胞测序系列（1）--单细胞全基因组测序

全基因组测序的7个概念（学徒翻译）

基因组测序简介

转移性尿路上皮癌全基因组测序

宏基因组建库测序

全基因组 - 人类基因组变异分析 (PacBio）（6）-- ANNOVAR

【精度平均最高80%】机器学习+全基因组测序，准确预测人体特征

基于PacBio HiFi数据的人类全基因组重测序变异分析流程

肿瘤基因组测序数据高级分析--肿瘤基因组测序数据分析专栏

Science封面6连发：人类最完整的基因组测序完成！

单基因结合全基因组发6分SCI

大肠杆菌全基因组重测序变异检测小实例（侧重变异过滤）

二代测序基因组拼接实战

二代测序宏基因组拼接

短讯 | 利用开源 Galaxy 平台简化临床细菌全基因组测序数据分析

69 种基于全基因组测序数据分析结构变异的算法评估

day6-测序知识

GENIE | 大型肿瘤基因组测序数据集

二代测序的基因组数据分析入门（illumina测序原理篇）

使用SPAdes测序数据拼接软件拼装基因组

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐