搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏生信开发者
WGS分析及检测建议
WGS最近又成为了风口，但WGS分析很难，相信坚持难而正确的事，一定会有收获。下边是本人近期总结的一些WGS的分析思路心得。 /intergenic区预测影响剪接（比如spliceAI预测的）的位点有overlap的其他变异（比如CNV 比如MEI）最好都保留下 WGS的CNV分析应该基于三种分析思路第一种是基于低深度CNVseq 并不是因为WGS比WES诊断率能高很多，但因为其相比WES更快速更低成本的建库、加速软件赋能生信分析，测序成本下降，更全面的变异分析维度，和越来越高效、精准的生信工具的迭代，WGS的价值越来越高。但生信二级分析和三级解读以及数据存储将成为瓶颈，按胎儿WGS专家来算的话，存储5年，将是不小的成本。本人已从上一个单位离职了，后续如果大家有WES/WGS/CNVseq/中深度CNVseq数据分析、panel设计和定制（比如定制自己的携带者筛查panel）、特殊基因/疾病分析（如SMA、DMD、α地贫
65010编辑于 2024-07-15
来自专栏「毅硕|生信教程」
Sentieon | 小麦全基组（WGS）分析流程
测试小麦样本平均测序深度7.55x，从FastQ到VCF全流程分析最快用时1.4个小时，大幅缩短小麦全基因组WGS分析时间，有效加快小麦的分子育种进程。 root：sentieon工具（基因组分析软件）的安装路径。 $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 自动化：自动检测测序平台和参考基因组以决定最佳分析策略。稳健性：使用 set -euxo pipefail和标记文件实现错误处理和断点续跑。模块化：将每个分析步骤封装成函数。从FastQ到VCF全流程分析最快用时1.4个小时，大幅缩短小麦全基因组WGS分析时间，有效加快小麦的分子育种进程。
33310编辑于 2025-09-25
Sentieon | 猪全基组（WGS）分析流程
测试猪样本测序深度9.98X，从FASTQ到VCF全流程分析最快用时14.74分钟，大幅缩短了猪全基因组WGS分析时间，有效加快动物的分子育种进程。 root：sentieon工具（基因组分析软件）的安装路径。 $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 自动化：自动检测测序平台和参考基因组以决定最佳分析策略。稳健性：使用 set -euxo pipefail和标记文件实现错误处理和断点续跑。模块化：将每个分析步骤封装成函数。从FastQ到gVCF全流程分析最快用时14.74分钟，大幅缩短了猪的全基因组WGS分析时间，有效加快动物的分子育种进程。
27510编辑于 2025-10-11
来自专栏Sentieon
Sentieon | 水稻全基因组（WGS）分析流程
测试水稻样本测序深度36.98X，从FASTQ到VCF全流程分析最快用时8分钟，大幅缩短了水稻全基因组WGS分析时间，有效加快水稻的分子育种进程。 $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 从FastQ到VCF全流程分析最快用时8分钟，大幅缩短了水稻的全基因组WGS分析时间，有效加快作物的分子育种进程。 Sentieon软件介绍Sentieon为完整的纯软件基因变异检测二级分析方案，其分析流程完全忠于BWA、GATK、MuTect2、STAR、Minimap2、Fgbio、picard等金标准的数学模型在匹配开源流程分析结果的前提下，大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度，并匹配目前全部第二代、三代测序平台。
39610编辑于 2025-10-29
Sentieon | 鸡全基因组（WGS）分析流程
测试鸡样本测序深度55.26X，从FASTQ到VCF全流程分析最快用时29.21分钟，大幅缩短了鸡的全基因组WGS分析时间，有效加快畜禽的分子育种进程。 $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 从FastQ到VCF全流程分析最快用时29.21分钟，大幅缩短了鸡的全基因组WGS分析时间，有效加快畜禽的分子育种进程。 Sentieon软件介绍Sentieon为完整的纯软件基因变异检测二级分析方案，其分析流程完全忠于BWA、GATK、MuTect2、STAR、Minimap2、Fgbio、picard等金标准的数学模型在匹配开源流程分析结果的前提下，大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度，并匹配目前全部第二代、三代测序平台。
26810编辑于 2025-11-11
来自专栏生信菜鸟团
【WGS分析实战-02】从GenotypeGVCFs到获取SNP数据集
上一期见：WGS分析实战-01：从SRA数据下载到构建GenomicsDatabase GenotypeGVCFs for id in {1..5} do echo "gatk --java-options genotyping.commandlines done # 仍旧使用ParaFly ParaFly -c genotyping.commandlines -CPU 5 1>genotyping.time.log 2> SNP -O SNP.chr${id}.vcf.gz" >> selectSNP.commandlines done ParaFly -c selectSNP.commandlines -CPU 5 2> selectBIALLELIC.err.log & 2.INDEL数据集获取后续分析，即VariantFiltration该步骤需要分别不同类型对原始数据进行过滤，那这边还是先拆开再进行分析 # PASS.filtered.BIALLELIC.SNP.chr5.vcf.gz \ O=ALL.PASS.filtered.BIALLELIC.SNP.vcf.gz 到这一步就获得可以用于后续分析的
4K30编辑于 2022-05-24
来自专栏生信技能树
PCAWG计划-原发肿瘤的WGS数据整合分析
Genet. 2013 45:1113), 因为TCGA计划涉及到数据类型比较多，仅仅是DNA层面就有WGS,WES,SNP6.0芯片的数据，其中一万多个病人里面有WGS数据的有两千多个病人，而PCAWG 计划就是整合所有的WGS数据结果。 ICGC是官网 https://dcc.icgc.org/pcawg 写清楚了两千多个病人的WGS数据来源于哪些项目哪些癌症！ ? 分析了2520对肿瘤和正常组织的全基因组测序数据，平均测序深度分别为106X和38X，共鉴定出7000万个体细胞突变。
2.3K40发布于 2019-12-05
来自专栏生信菜鸟团
WGS分析实战-01：从SRA数据下载到构建GenomicsDatabase
energy transfer heavy-ion irradiation demonstrated by whole-genome resequencing of Arabidopsis mutants》分析用到的软件 bwa GATK、picard （1）原始测序数据 & 参考基因组下载 & 索引构建首先根据文章的Bioproject编号（PRJDB5412），找到SRA Experiments这一栏文章中用于分析的样本有 haplotypecaller.err.log & 这些gvcf文件的大小差异有点大，基于该实验设计似乎又蛮合理，不同程度的辐射对突变位点数量的影响肯定是不一样的，但是这还是只是GATK分析的第一步， # 2、GenomicsDBImport ls *.g.vcf.gz > gvcf_id.txt cut -d "." genomicsDB_build.err.log & 上述这些步骤还不需要纠结很多分析参数，到了GATK硬过滤的时候，就需要考虑了。
2.6K31编辑于 2022-04-08
来自专栏生信开发者
中深度WGS测序应用
目前低深度WGS（CNVseq）和高深度WGS都已出专家共识了，其实中深度WGS也有很大的优势和应用价值。而10x WGS的测序量，平均每300bp就有10条fragments，每1kb既有33条fragments，每5kb就有167条fragments 2. 10x WGS可call到比较多有一定可靠度的点突变，我们可利用这些点突变的VAF分布来分析多倍体和LOH（UPD）； 3. 可分析一定可靠度的SV； 4.可分析一定可靠度的移动重复元件； 5. 可利用SNP或STR信息，区分父源、母源缺失/重复；然而，在非唯一比对区域、重复区域、或GC异常区域，不论是CMA还是低深度CNVseq或者中深度、高深度WGS都是检测盲区。
1.1K30编辑于 2022-03-08
Sentieon | 野草莓（Fragaria vesca）全基因组WGS分析流程
测试野草莓样本测序深度82.91X，从FASTQ到VCF全流程分析最快用时8.15分钟，大幅压缩了植物群体基因组分析时间，加快科研成果转化。 root：sentieon工具（基因组分析软件）的安装路径。 $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 自动化：自动检测测序平台和参考基因组以决定最佳分析策略。稳健性：使用 set -euxo pipefail和标记文件实现错误处理和断点续跑。模块化：将每个分析步骤封装成函数。从FastQ到VCF全流程分析最快用时8.15分钟，大幅压缩了植物群体基因组分析时间，加快科研成果转化。Sentieon在不断地优化算法的运行效率，为科研工作者提供更快速、更经济的基因检测方案。
19810编辑于 2026-01-07
来自专栏生信开发者
Hybrid WGS您考虑么
现在临床应用WGS还是主流用的NGS，WGS专家共识也指出推荐测40x以上，但在高度冗余的重复序列区域、高GC区域等等是NGS的盲区，而且call 出来的结构变异的假阳性较多，流程的分析复杂度也较高，让人头疼类似当年 Hybrid Assembly的思路，假如我们将WGS用NGS测到30-40x，用TGS测到10x以上，那么理论上我们既能保证SNV的准确性，又能广泛地用TGS覆盖NGS的盲区，得到更加可靠的结构变异的结果
23510编辑于 2023-12-24
来自专栏生信技能树
【直播】我的基因组 43：简单粗糙的WGS数据分析流程
就是拿到了fastq的测序数据，如何把全基因组分析给跑一遍。(不谈细节！) 首先就是fastq文件比对到参考基因组变成sam文件： head -40 read1.fq >tmp/read1.fq head -40 read2.fq >tmp/read2.fq ~/biosoft 由下图可以看到我们sort的bam文件不是按照染色体的1,2,3排序，而是按照chr10,chr11,,,,chr1,,chr2这样的顺序，这个对很多其它软件会不友好。 ? 事实上，对我们真实的WGS数据来说，这一步耗时很严重的！(时间开销在后面) ? 第二个步骤，就是call variation咯，下面两个软件都可以，用起来也很简单。也就是说完成一个全基因组数据(300G的原始数据)的分析，是需要整整两天两夜的！ ? 但是大家可能在朋友圈多次看到各种宣传贴21小时完成千人的全基因组分析，为什么呢？
2K90发布于 2018-03-08
来自专栏生信探索
基因组实战03: WGS toy example
分析的数据是大肠杆菌，因为基因组小，适合拿来快速跑通整个流程 00 下载fastq数据图片 mkdir -p ~/Project/DNA/raw cd ~/Project/DNA/raw wget ftp $CLEAN_DIR/$SAMPLE"_2.fastq.gz" RG="@RG\tID:"$SAMPLE"\tSM:"$SAMPLE"\tLB:WGS\tPL:ILLUMINA" bwa //gatk.broadinstitute.org/hc/en-us/articles/13832655155099--Tool-Documentation-Index #GATK4.0和全基因组数据分析实践 /s/8hY0U48kiVTH6Yx4JBcAhg# #第4节构建WGS主流程 https://mp.weixin.qq.com/s/AT2oodvdqWgbj1gvVo1hWQ #第5节理解并操作 BAM文件 https://mp.weixin.qq.com/s/UnMyAuUHmK7DMGo8h88oQw # WGS(全基因组测序)/WES(全外显子组测序)/WGRS(全基因组重测序)分析与可视化教程
56510编辑于 2023-03-31
来自专栏点点GIS
百度火星坐标转wgs84
WGS84坐标系即地球坐标系，国际上通用的坐标系。设备一般包含GPS芯片或者北斗芯片获取的经纬度为WGS84地理坐标系。谷歌地图采用的是WGS84地理坐标系（中国范围除外,谷歌中国地图采用的是GCJ02地理坐标系。) GCJ02坐标系（高德使用）即火星坐标系，WGS84坐标系经加密后的坐标系。
1.3K20发布于 2021-08-18
来自专栏生信菜鸟团
大规模癌症WGS识别驱动基因突变
写在最后： WGS 数据分析的需求正在日益增长，学习WGS数据分析也更具有价值： 1.技术进步的呼唤： "随着WGS技术的成本降低和效率提升，现在是学习WGS数据分析的最佳时机。 2.未来趋势的引导： "WGS正迅速成为临床和研究的主流技术。学习WGS数据分析，不仅能够让你紧跟科学发展的步伐，还能为你的职业生涯开启新的可能性。" 3.成本效益的吸引： "考虑到WGS的实验室成本已经降至一个可接受的水平，现在是时候投身于WGS数据分析技能了。这将为你在生物信息学领域提供无与伦比的竞争优势。" 4.全面分析的潜力： "WGS提供了更全面的变异分析维度，学习WGS数据分析将使你能够解锁基因组中的更多秘密，为疾病诊断和治疗提供更深入的见解。" 5.数据挑战的应对： "尽管WGS生物信息学分析和数据存储可能面临挑战，但学习WGS数据分析将使你能够应对这些挑战，成为该领域的专家。"
41910编辑于 2024-07-10
来自专栏生信技能树
WES，WGS等DNA测序数据找变异流程服务
肿瘤或者家系的WES，WGS等DNA测序样品的fastq数据，需要比对到参考基因组并且找变异并且注释，我们仅仅是收取一个计算机资源的费用，800-8000元人民币（根据样品数量不同收费不一样）即可， #我们这里的质控结果显示reads的整体质量还不错（GC含量看着不太过分基本不影响后续的分析），可以直接用于比对 ls .. %_*} bwa mem -t 8 -R "@RG\tID:$sample\tSM:$sample\tLB:WGS\tPL:Illumina" /$index $fq1 $fq2 |samtools sort 这也是进一步检验我们pipeline的正确性的重要环节（当然也不能迷信文章的结果，但是7+文章的数据分析质量应该还是可以作为一个较好的参考）。 2、WES的相关分析还有很多，我们这里只涉及到SNV。同样的，突变的注释也涉及到多种软件，我们这里只涉及到了SnpEff。学海无涯啊~~~从培养起自主学习的思维和习惯开始。
2.8K10发布于 2021-10-21
来自专栏生信开发者
WGS只能call SNV、CNV、SV和mtDNA变异？
WGS的在遗传病检测中的临床应用专家共识已经发布一段时间了，但如果只是用WGS来分析SNV、CNV、SV和mtDNA变异就有点太吃亏了，WGS可分析挖掘的内容是在太多了，本人从github上随意找了些 ://github.com/mgymrek/lobstr-code HLA https://github.com/DiltheyLab/HLA-LA https://github.com/FRED-2/ integrating copy number alterations and loss of heterozygosity https://github.com/uci-cbcl/PyLOH 注：以上分析工具绝大部分用于科研本人再给几个WGS的建议： 1. PCR free建库，保证在基因组分布的均一性。 2. WGS有可能因为测序的不均一性，存在在部分编码区测序深度不足的情况，导致分析SNV时出现假阴性的情况。
1.2K30编辑于 2022-03-08
来自专栏云深之无迹
microPython源码分析.2
即使是mpy也不例外，所以我们的py目录下的文件是最主要的就像这个样子的我们再打开这个ESP32的目录，其实你第一个hello打印出来的时候就知道一个完整的C程序一定只有一个main入口，所以我们分析从这里开始是正确的
1.4K30发布于 2021-04-14
来自专栏Java架构师必看
Spring源码分析2
Spring源码分析2 强烈推介IDEA2020.2破解激活，IntelliJ
34820发布于 2021-05-14
来自专栏学习笔记ol
框架分析（2）-React
框架分析（2）-React 主要对目前市面上常见的框架进行分析和总结，希望有兴趣的小伙伴们可以看一下，会持续更新的。希望各位可以监督我，我们一起学习进步。优缺点分析优点 1、虚拟DOM React使用虚拟DOM来管理和更新页面上的元素。虚拟DOM是一个轻量级的JavaScript对象，可以在内存中进行操作，然后将更改批量应用到实际的DOM上。 2、组件化开发 React鼓励开发者将应用程序拆分成多个可重用的组件。每个组件都有自己的状态和属性，可以独立地进行开发、测试和维护。 2、生态系统的快速变化 React的生态系统和社区在不断发展和变化，新的库和工具不断涌现。这可能导致开发者需要不断跟进和学习新的技术，以便保持在开发中的竞争力。
35730编辑于 2023-10-11

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

WGS分析及检测建议

Sentieon | 小麦全基组（WGS）分析流程

Sentieon | 猪全基组（WGS）分析流程

Sentieon | 水稻全基因组（WGS）分析流程

Sentieon | 鸡全基因组（WGS）分析流程

【WGS分析实战-02】从GenotypeGVCFs到获取SNP数据集

PCAWG计划-原发肿瘤的WGS数据整合分析

WGS分析实战-01：从SRA数据下载到构建GenomicsDatabase

中深度WGS测序应用

Sentieon | 野草莓（Fragaria vesca）全基因组WGS分析流程

Hybrid WGS您考虑么

【直播】我的基因组 43：简单粗糙的WGS数据分析流程

基因组实战03: WGS toy example

百度火星坐标转wgs84

大规模癌症WGS识别驱动基因突变

WES，WGS等DNA测序数据找变异流程服务

WGS只能call SNV、CNV、SV和mtDNA变异？

microPython源码分析.2

Spring源码分析2

框架分析（2）-React

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐