首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信开发者

    WGS分析及检测建议

    WGS最近又成为了风口,但WGS分析很难,相信坚持难而正确的事,一定会有收获。下边是本人近期总结的一些WGS分析思路心得。 /intergenic区预测影响剪接(比如spliceAI预测的)的位点有overlap的其他变异(比如CNV 比如MEI)最好都保留下 WGS的CNV分析应该基于三种分析思路 第一种是基于低深度CNVseq 并不是因为WGS比WES诊断率能高很多,但因为其相比WES更快速更低成本的建库、加速软件赋能生信分析,测序成本下降,更全面的变异分析维度,和越来越高效、精准的生信工具的迭代,WGS的价值越来越高。 但生信二级分析和三级解读以及数据存储将成为瓶颈,按胎儿WGS专家来算的话,存储5年,将是不小的成本。 本人已从上一个单位离职了,后续如果大家有WES/WGS/CNVseq/中深度CNVseq数据分析、panel设计和定制(比如定制自己的携带者筛查panel)、特殊基因/疾病分析(如SMA、DMD、α地贫

    65010编辑于 2024-07-15
  • 来自专栏「毅硕|生信教程」

    Sentieon | 小麦全基组(WGS分析流程

    测试小麦样本平均测序深度7.55x,从FastQ到VCF全流程分析最快用时1.4个小时,大幅缩短小麦全基因组WGS分析时间,有效加快小麦的分子育种进程。 1=$3 export FASTQ_2=$4 export FASTA=$5 BSUFFIX=$6 TYPE=${7:-"raw"} KEEP_CLEAN=${8:-keep} KEEP_BAM=${9: $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 9.   从FastQ到VCF全流程分析最快用时1.4个小时,大幅缩短小麦全基因组WGS分析时间,有效加快小麦的分子育种进程。

    33310编辑于 2025-09-25
  • Sentieon | 猪全基组(WGS分析流程

    测试猪样本测序深度9.98X,从FASTQ到VCF全流程分析最快用时14.74分钟,大幅缩短了猪全基因组WGS分析时间,有效加快动物的分子育种进程。 FASTQ_1=$3export FASTQ_2=$4export FASTA=$5BSUFFIX=$6TYPE=${7:-"raw"}KEEP_CLEAN=${8:-keep}KEEP_BAM=${9: $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 9.   从FastQ到gVCF全流程分析最快用时14.74分钟,大幅缩短了猪的全基因组WGS分析时间,有效加快动物的分子育种进程。

    27510编辑于 2025-10-11
  • 来自专栏Sentieon

    Sentieon | 水稻全基因组(WGS分析流程

    测试水稻样本测序深度36.98X,从FASTQ到VCF全流程分析最快用时8分钟,大幅缩短了水稻全基因组WGS分析时间,有效加快水稻的分子育种进程。 FASTQ_1=$3export FASTQ_2=$4export FASTA=$5BSUFFIX=$6TYPE=${7:-"raw"}KEEP_CLEAN=${8:-keep}KEEP_BAM=${9: 9. 从FastQ到VCF全流程分析最快用时8分钟,大幅缩短了水稻的全基因组WGS分析时间,有效加快作物的分子育种进程。 在匹配开源流程分析结果的前提下,大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度,并匹配目前全部第二代、三代测序平台。

    39610编辑于 2025-10-29
  • Sentieon | 鸡全基因组(WGS分析流程

    测试鸡样本测序深度55.26X,从FASTQ到VCF全流程分析最快用时29.21分钟,大幅缩短了鸡的全基因组WGS分析时间,有效加快畜禽的分子育种进程。 FASTQ_1=$3export FASTQ_2=$4export FASTA=$5BSUFFIX=$6TYPE=${7:-"raw"}KEEP_CLEAN=${8:-keep}KEEP_BAM=${9: 9. 从FastQ到VCF全流程分析最快用时29.21分钟,大幅缩短了鸡的全基因组WGS分析时间,有效加快畜禽的分子育种进程。 在匹配开源流程分析结果的前提下,大幅提升WGS、WES、Panel、UMI、ctDNA、RNA等测序数据的分析效率和检出精度,并匹配目前全部第二代、三代测序平台。

    26810编辑于 2025-11-11
  • 来自专栏生信菜鸟团

    WGS分析实战-02】从GenotypeGVCFs到获取SNP数据集

    上一期见:WGS分析实战-01:从SRA数据下载到构建GenomicsDatabase GenotypeGVCFs for id in {1..5} do echo "gatk --java-options selectBIALLELIC.commandlines done ParaFly -c selectBIALLELIC.commandlines -CPU 5 2>selectBIALLELIC.err.log & 2.INDEL数据集获取 后续分析 ,即VariantFiltration该步骤需要分别不同类型对原始数据进行过滤,那这边还是先拆开再进行分析 # 提取INDEL for id in {1..5} do echo "gatk --java-options PASS.filtered.BIALLELIC.SNP.chr5.vcf.gz \ O=ALL.PASS.filtered.BIALLELIC.SNP.vcf.gz 到这一步就获得可以用于后续分析

    4K30编辑于 2022-05-24
  • 来自专栏生信技能树

    PCAWG计划-原发肿瘤的WGS数据整合分析

    Genet. 2013 45:1113), 因为TCGA计划涉及到数据类型比较多,仅仅是DNA层面就有WGS,WES,SNP6.0芯片的数据,其中一万多个病人里面有WGS数据的有两千多个病人,而PCAWG 计划就是整合所有的WGS数据结果。 ICGC是官网 https://dcc.icgc.org/pcawg 写清楚了两千多个病人的WGS数据来源于哪些项目哪些癌症! ? 分析了2520对肿瘤和正常组织的全基因组测序数据,平均测序深度分别为106X和38X,共鉴定出7000万个体细胞突变。

    2.3K40发布于 2019-12-05
  • 来自专栏生信菜鸟团

    WGS分析实战-01:从SRA数据下载到构建GenomicsDatabase

    energy transfer heavy-ion irradiation demonstrated by whole-genome resequencing of Arabidopsis mutants》 分析用到的软件 bwa GATK、picard (1)原始测序数据 & 参考基因组下载 & 索引构建 首先根据文章的Bioproject编号(PRJDB5412),找到SRA Experiments这一栏 文章中用于分析的样本有 16 2>haplotypecaller.err.log & 这些gvcf文件的大小差异有点大,基于该实验设计似乎又蛮合理,不同程度的辐射对突变位点数量的影响肯定是不一样的,但是这还是只是GATK分析的第一步 my_database \ --sample-name-map $samplemap \ -L $interval_list 2>genomicsDB_build.err.log & 上述这些步骤还不需要纠结很多分析参数

    2.6K31编辑于 2022-04-08
  • 来自专栏生信开发者

    中深度WGS测序应用

    目前低深度WGS(CNVseq)和高深度WGS都已出专家共识了,其实中深度WGS也有很大的优势和应用价值。 而10x WGS的测序量,平均每300bp就有10条fragments,每1kb既有33条fragments,每5kb就有167条fragments 2. 10x WGS可call到比较多有一定可靠度的点突变 ,我们可利用这些点突变的VAF分布来分析多倍体和LOH(UPD); 3. 可分析一定可靠度的SV; 4.可分析一定可靠度的移动重复元件; 5. 可利用SNP或STR信息,区分父源、母源缺失/重复; 然而,在非唯一比对区域、重复区域、或GC异常区域,不论是CMA还是低深度CNVseq或者中深度、高深度WGS都是检测盲区。

    1.1K30编辑于 2022-03-08
  • Sentieon | 野草莓(Fragaria vesca)全基因组WGS分析流程

    测试野草莓样本测序深度82.91X,从FASTQ到VCF全流程分析最快用时8.15分钟,大幅压缩了植物群体基因组分析时间,加快科研成果转化。 FASTQ_1=$3export FASTQ_2=$4export FASTA=$5BSUFFIX=$6TYPE=${7:-"raw"}KEEP_CLEAN=${8:-keep}KEEP_BAM=${9: fasta 文件$6BSUFFIX输出格式:bam/cram/空格无默认$7TYPE数据类型:"raw" 或 "clean""raw"$8KEEP_CLEAN是否保留质控后的 fastq"keep"$9KEEP_BAM $SUFFIX --algo WgsMetricsAlgo $SAMPLEID.WGS_METRICS.txt --algo MeanQualityByCycle $SAMPLEID.mq_metrics.txt 9.

    19810编辑于 2026-01-07
  • 来自专栏生信开发者

    Hybrid WGS您考虑么

    现在临床应用WGS还是主流用的NGS,WGS专家共识也指出推荐测40x以上,但在高度冗余的重复序列区域、高GC区域等等是NGS的盲区,而且call 出来的结构变异的假阳性较多,流程的分析复杂度也较高,让人头疼 类似当年 Hybrid Assembly的思路,假如我们将WGS用NGS测到30-40x,用TGS测到10x以上,那么理论上我们既能保证SNV的准确性,又能广泛地用TGS覆盖NGS的盲区,得到更加可靠的结构变异的结果

    23510编辑于 2023-12-24
  • 来自专栏Java架构师必看

    spring源码分析9

    spring源码分析9 强烈推介IDEA2020.2破解激活,IntelliJ

    42720发布于 2021-04-13
  • 来自专栏生信技能树

    【直播】我的基因组 43:简单粗糙的WGS数据分析流程

    就是拿到了fastq的测序数据,如何把全基因组分析给跑一遍。(不谈细节!) 事实上,对我们真实的WGS数据来说,这一步耗时很严重的!(时间开销在后面) ? 第二个步骤,就是call variation咯,下面两个软件都可以,用起来也很简单。 也就是说完成一个全基因组数据(300G的原始数据)的分析,是需要整整两天两夜的! ? 但是大家可能在朋友圈多次看到各种宣传贴21小时完成千人的全基因组分析,为什么呢?

    2K90发布于 2018-03-08
  • 来自专栏学习笔记ol

    框架分析9)-Hibernate

    框架分析9)-Hibernate 主要对目前市面上常见的框架进行分析和总结,希望有兴趣的小伙伴们可以看一下,会持续更新的。希望各位可以监督我,我们一起学习进步。

    47520编辑于 2023-10-11
  • 来自专栏golang算法架构leetcode技术php

    golang源码分析9)调度

    o编写一个并发编程程序很简单,只需要在函数之前使用一个Go关键字就可以实现并发编程。

    54720编辑于 2022-08-02
  • 来自专栏生信探索

    基因组实战03: WGS toy example

    分析的数据是大肠杆菌,因为基因组小,适合拿来快速跑通整个流程 00 下载fastq数据 图片 mkdir -p ~/Project/DNA/raw cd ~/Project/DNA/raw wget ftp SAMPLE"_1.fastq.gz" F2=$CLEAN_DIR/$SAMPLE"_2.fastq.gz" RG="@RG\tID:"$SAMPLE"\tSM:"$SAMPLE"\tLB:WGS https://mp.weixin.qq.com/s/r3sghKtEKq1FnjQ05WCcnA # 第1节 测序技术 https://mp.weixin.qq.com/s/kq2i5tNZmm9GKGAx2Day-g mp.weixin.qq.com/s/0h5B3T6RKTHTsZBuoZvtgQ #第3节 数据质控 https://mp.weixin.qq.com/s/8hY0U48kiVTH6Yx4JBcAhg# #第4节 构建WGS mp.weixin.qq.com/s/AT2oodvdqWgbj1gvVo1hWQ #第5节 理解并操作BAM文件 https://mp.weixin.qq.com/s/UnMyAuUHmK7DMGo8h88oQw # WGS

    56510编辑于 2023-03-31
  • 来自专栏golang算法架构leetcode技术php

    golang源码分析:cayley(9)

    中间使用到了goja解析器,它的作用是在golang环境中翻译执行javascript,因为我们的gizmo采用的是javascript语法。

    33720编辑于 2023-08-09
  • golang源码分析 :gopls(9

    最后我们来到了第三部分featureCommands,也是所有命令的大头,这里一共初始化了23个命令。我们首先看下第一个callHierarchy

    9410编辑于 2026-03-18
  • golang源码分析:langchaingo(9

    前面介绍了单独的匹配,如果把这个匹配过程接入到LLM,就是完整的RAG,即检索增强生成。我们先看看上一个例子还没介绍的最后几行代码

    6210编辑于 2026-03-18
  • 来自专栏点点GIS

    百度火星坐标转wgs84

    WGS84坐标系 即地球坐标系,国际上通用的坐标系。 设备一般包含GPS芯片或者北斗芯片获取的经纬度为WGS84地理坐标系。 谷歌地图采用的是WGS84地理坐标系(中国范围除外,谷歌中国地图采用的是GCJ02地理坐标系。) GCJ02坐标系(高德使用) 即火星坐标系,WGS84坐标系经加密后的坐标系。

    1.3K20发布于 2021-08-18
领券