首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信开发者

    WGS分析及检测建议

    WGS最近又成为了风口,但WGS分析很难,相信坚持难而正确的事,一定会有收获。下边是本人近期总结的一些WGS的分析思路心得。 但我们也已差不多99%以上能搞定了 所有 intronic/intergenic区预测影响剪接(比如spliceAI预测的)的位点有overlap的其他变异(比如CNV 比如MEI)最好都保留下 WGS ,相信接下来一两年内WGS将快速取代WES进入临床应用。 并不是因为WGS比WES诊断率能高很多,但因为其相比WES更快速更低成本的建库、加速软件赋能生信分析,测序成本下降,更全面的变异分析维度,和越来越高效、精准的生信工具的迭代,WGS的价值越来越高。 但生信二级分析和三级解读以及数据存储将成为瓶颈,按胎儿WGS专家来算的话,存储5年,将是不小的成本。

    60510编辑于 2024-07-15
  • 来自专栏生信开发者

    中深度WGS测序应用

    目前低深度WGS(CNVseq)和高深度WGS都已出专家共识了,其实中深度WGS也有很大的优势和应用价值。 样本量 能检测全基因组范围的CNV,相比CMA覆盖范围更广,灵敏度更高 可检测超过300种染色体疾病(含CNV和非整倍体),全面排查染色体异常 可检测大于5%的低比例非整倍嵌合 采用PCR free WGS 而10x WGS的测序量,平均每300bp就有10条fragments,每1kb既有33条fragments,每5kb就有167条fragments 2. 10x WGS可call到比较多有一定可靠度的点突变 可利用SNP或STR信息,区分父源、母源缺失/重复; 然而,在非唯一比对区域、重复区域、或GC异常区域,不论是CMA还是低深度CNVseq或者中深度、高深度WGS都是检测盲区。

    1.1K30编辑于 2022-03-08
  • 来自专栏生信开发者

    Hybrid WGS您考虑么

    现在临床应用WGS还是主流用的NGS,WGS专家共识也指出推荐测40x以上,但在高度冗余的重复序列区域、高GC区域等等是NGS的盲区,而且call 出来的结构变异的假阳性较多,流程的分析复杂度也较高,让人头疼 类似当年 Hybrid Assembly的思路,假如我们将WGS用NGS测到30-40x,用TGS测到10x以上,那么理论上我们既能保证SNV的准确性,又能广泛地用TGS覆盖NGS的盲区,得到更加可靠的结构变异的结果

    21810编辑于 2023-12-24
  • 来自专栏「毅硕|生信教程」

    Sentieon | 小麦全基组(WGS)分析流程

    测试小麦样本平均测序深度7.55x,从FastQ到VCF全流程分析最快用时1.4个小时,大幅缩短小麦全基因组WGS分析时间,有效加快小麦的分子育种进程。 $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 从FastQ到VCF全流程分析最快用时1.4个小时,大幅缩短小麦全基因组WGS分析时间,有效加快小麦的分子育种进程。

    29810编辑于 2025-09-25
  • 来自专栏生信探索

    基因组实战03: WGS toy example

    SAMPLE"_1.fastq.gz" F2=$CLEAN_DIR/$SAMPLE"_2.fastq.gz" RG="@RG\tID:"$SAMPLE"\tSM:"$SAMPLE"\tLB:WGS mp.weixin.qq.com/s/0h5B3T6RKTHTsZBuoZvtgQ #第3节 数据质控 https://mp.weixin.qq.com/s/8hY0U48kiVTH6Yx4JBcAhg# #第4节 构建WGS mp.weixin.qq.com/s/AT2oodvdqWgbj1gvVo1hWQ #第5节 理解并操作BAM文件 https://mp.weixin.qq.com/s/UnMyAuUHmK7DMGo8h88oQw # WGS

    54910编辑于 2023-03-31
  • Sentieon | 猪全基组(WGS)分析流程

    测试猪样本测序深度9.98X,从FASTQ到VCF全流程分析最快用时14.74分钟,大幅缩短了猪全基因组WGS分析时间,有效加快动物的分子育种进程。 $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 从FastQ到gVCF全流程分析最快用时14.74分钟,大幅缩短了猪的全基因组WGS分析时间,有效加快动物的分子育种进程。

    23410编辑于 2025-10-11
  • 来自专栏点点GIS

    百度火星坐标转wgs84

    WGS84坐标系 即地球坐标系,国际上通用的坐标系。 设备一般包含GPS芯片或者北斗芯片获取的经纬度为WGS84地理坐标系。 谷歌地图采用的是WGS84地理坐标系(中国范围除外,谷歌中国地图采用的是GCJ02地理坐标系。) GCJ02坐标系(高德使用) 即火星坐标系,WGS84坐标系经加密后的坐标系。

    1.3K20发布于 2021-08-18
  • 来自专栏生信菜鸟团

    大规模癌症WGS识别驱动基因突变

    写在最后: WGS 数据分析的需求正在日益增长,学习WGS数据分析也更具有价值: 1.技术进步的呼唤: "随着WGS技术的成本降低和效率提升,现在是学习WGS数据分析的最佳时机。 2.未来趋势的引导: "WGS正迅速成为临床和研究的主流技术。学习WGS数据分析,不仅能够让你紧跟科学发展的步伐,还能为你的职业生涯开启新的可能性。" 3.成本效益的吸引: "考虑到WGS的实验室成本已经降至一个可接受的水平,现在是时候投身于WGS数据分析技能了。这将为你在生物信息学领域提供无与伦比的竞争优势。" 4.全面分析的潜力: "WGS提供了更全面的变异分析维度,学习WGS数据分析将使你能够解锁基因组中的更多秘密,为疾病诊断和治疗提供更深入的见解。" 5.数据挑战的应对: "尽管WGS生物信息学分析和数据存储可能面临挑战,但学习WGS数据分析将使你能够应对这些挑战,成为该领域的专家。"

    39210编辑于 2024-07-10
  • 来自专栏生信菜鸟团

    WGS分析实战-02】从GenotypeGVCFs到获取SNP数据集

    上一期见:WGS分析实战-01:从SRA数据下载到构建GenomicsDatabase GenotypeGVCFs for id in {1..5} do echo "gatk --java-options

    3.9K30编辑于 2022-05-24
  • 来自专栏生信技能树

    WES,WGS等DNA测序数据找变异流程服务

    肿瘤或者家系的WES,WGS等DNA测序样品的fastq数据,需要比对到参考基因组并且找变异并且注释,我们仅仅是收取一个计算机资源的费用,800-8000元人民币(根据样品数量不同收费不一样)即可, id}) fq1=${arr[0]} fq2=${arr[1]} sample=${fq1%%_*} bwa mem -t 8 -R "@RG\tID:$sample\tSM:$sample\tLB:WGS af-only-gnomad/af-only-gnomad.hg38.SNP_biallelic.vcf.gz genomic_intervals=/home/gongyuqi/ref/GATK/hg38/v0/wgs_calling_regions.hg38

    2.8K10发布于 2021-10-21
  • 来自专栏生信开发者

    WGS只能call SNV、CNV、SV和mtDNA变异?

    WGS的在遗传病检测中的临床应用专家共识已经发布一段时间了,但如果只是用WGS来分析SNV、CNV、SV和mtDNA变异就有点太吃亏了,WGS可分析挖掘的内容是在太多了,本人从github上随意找了些 SUwonglab/arcsv uses Read Pair and Split Read methods to identify structural variants in paired-end WGS 本人再给几个WGS的建议: 1. PCR free建库,保证在基因组分布的均一性。 2. Trio WGS模式测序,先证者测50x or higher,父母可根据经济条件选择性地降低测序深度(测20-30x?)或者不测。 WGS有可能因为测序的不均一性,存在在部分编码区测序深度不足的情况,导致分析SNV时出现假阴性的情况。

    1.1K30编辑于 2022-03-08
  • Sentieon | 鸡全基因组(WGS)分析流程

    测试鸡样本测序深度55.26X,从FASTQ到VCF全流程分析最快用时29.21分钟,大幅缩短了鸡的全基因组WGS分析时间,有效加快畜禽的分子育种进程。 $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 从FastQ到VCF全流程分析最快用时29.21分钟,大幅缩短了鸡的全基因组WGS分析时间,有效加快畜禽的分子育种进程。 在匹配开源流程分析结果的前提下,大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度,并匹配目前全部第二代、三代测序平台。

    23110编辑于 2025-11-11
  • 来自专栏Sentieon

    Sentieon | 水稻全基因组(WGS)分析流程

    测试水稻样本测序深度36.98X,从FASTQ到VCF全流程分析最快用时8分钟,大幅缩短了水稻全基因组WGS分析时间,有效加快水稻的分子育种进程。 $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 从FastQ到VCF全流程分析最快用时8分钟,大幅缩短了水稻的全基因组WGS分析时间,有效加快作物的分子育种进程。 在匹配开源流程分析结果的前提下,大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度,并匹配目前全部第二代、三代测序平台。

    33210编辑于 2025-10-29
  • 来自专栏生信技能树

    PCAWG计划-原发肿瘤的WGS数据整合分析

    Genet. 2013 45:1113), 因为TCGA计划涉及到数据类型比较多,仅仅是DNA层面就有WGS,WES,SNP6.0芯片的数据,其中一万多个病人里面有WGS数据的有两千多个病人,而PCAWG 计划就是整合所有的WGS数据结果。 ICGC是官网 https://dcc.icgc.org/pcawg 写清楚了两千多个病人的WGS数据来源于哪些项目哪些癌症! ?

    2.3K40发布于 2019-12-05
  • 来自专栏生信菜鸟团

    WGS分析实战-01:从SRA数据下载到构建GenomicsDatabase

    用于实战的数据集来自下面这篇于2017年发表在The Plant Journal的文章《Different mutational function of low- and high-linear energy transfer heavy-ion irradiation demonstrated by whole-genome resequencing of Arabidopsis mutants》

    2.6K31编辑于 2022-04-08
  • 来自专栏规划领域技术

    GCJ02BD09WGS84坐标转换脚本分享

    1) 支持火星坐标系(GCJ02)、百度坐标系(BD09)、WGS84(4326)间相互转换 2) 支持多个表格同时进行坐标转换,能够自动识别表格中的经纬度数据列,转换后写入原数据表格(xls表格)或另存为

    2.3K20发布于 2020-08-27
  • Sentieon | 野草莓(Fragaria vesca)全基因组WGS分析流程

    $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt

    12610编辑于 2026-01-07
  • 来自专栏生信技能树

    WGS,WES,RNA-seq组与ChIP-seq之间的异同

    2 理概念 理解了上面的测序深度和覆盖度的概念,我们就可以根据它们来区分WGS,WES,RNA-seq组与ChIP-seq,简单地说就是搞清楚这些组学要测什么,而且测多深即可。 最后是WGS测序,理论是它应该是全基因组覆盖,而且测序深度非常稳定,但是实际上,测序深度还部分由GC含量,扩增随机性影响。 写在最后 上面的WGS,WES,RNA-seq组与ChIP-seq之间的异同我曾经在生信菜鸟团QQ群里面讲解过,以QQ群视频的形式,而且还录制了视频,大家可以在公众号后台回复"组学"就可以获取啦!

    3.1K100发布于 2018-03-08
  • 来自专栏生信技能树

    【直播】我的基因组 43:简单粗糙的WGS数据分析流程

    事实上,对我们真实的WGS数据来说,这一步耗时很严重的!(时间开销在后面) ? 第二个步骤,就是call variation咯,下面两个软件都可以,用起来也很简单。

    2K90发布于 2018-03-08
  • 来自专栏生信技能树

    基因组分区研究(WGS和表观组学不一样)

    主要是考虑变异位点的生物学功能倾向性,来自于文章:Landscape of somatic mutations in 560 breast cancer whole genome sequences,是非常值得模仿的分析方法,可以看到WGS

    90750发布于 2020-04-14
领券