主要是参考这个进行的,https://github.com/humanlongevity/HLA 其文章在这:http://www.pnas.org/content/early/2017/06/27/1707945114
也就是说PCR就是用来复制DNA片段的,最理想的NGS数据分析,就是尽可能把通过PCR获得的子链出数据全部去除,当PCR没发生过一样。
发现wegene的NGS HLA分型报告是用的这个软件的参考文献,估计还是权威些的。 软件使用方法也有了一些变化,之前只是一个脚本,现在直接编译成了一个独立的可执行文件,运行效率应该也有很大的提高。
NGS系列文章包括NGS基础、转录组分析、ChIP-seq分析、DNA甲基化分析、重测序分析五部分内容。 NGS基础系列文章包括高通量测序原理,测序数据获取和质量评估,常见文件格式解释和转换4部分。
发现已经下载不到的软件是hla-hd, hlascan, 本来一直信任xhla,却发现这个软件竟然处理手上这个特殊的样本也报了个罕见错误,大概是可能性比较多,代码bug。soap-hla运行个perl报错,hlarepoter也没跑成功。
我们所说的单细胞时代,狭义地说,是高通量单细胞测序时代,这当然离不开NGS(Next Generation Sequencing)。 本文回顾了传统的单细胞测序技术,如Cel-seq, smart-seq,考察了微流控技术,重要的是,也关注了几种同时测定多模态的NGS单细胞技术。 扩增后,LMO片段通过大小选择从mRNA中分离出来,然后进行下一代测序(NGS)文库准备。这种技术被用于在不同转移进展阶段从病人来源的异种移植小鼠模型中分离出的冷冻保存的肺和原发性乳腺肿瘤。 另一半转化为双链cDNA,然后利用体外转录进行扩增,制备NGS RNA文库进行转录分析。DR-Seq被发现与现有的scRNA-seq方法一样有效,包括CEL-seq MALBAC。
值得一提的是对肿瘤外显子来分析CNV, 我测试过很多工具了: WES的CNV探究-conifer软件使用 单个样本NGS数据如何做拷贝数变异分析呢 肿瘤配对样本用varscan 做cnv分析 使用cnvkit 基于NGS数据的检测CNV 一般来说有三种主要的检测CNV的算法: 1) read count; 2) paired-end; 3) assembly 随着测序成本的降低以及测序深度的增加,read count NGS数据的CNV检测的挑战 虽然测序技术逐步在提高,检测 CNV 的软件也一直在更新,但是肿瘤样本中 somatic CNV 的检测依然存在一些挑战。基本挑战包括:测序数据质量和测序策略选择。
NGS基础 - FASTQ格式解释和质量评估 NGS基础 - 高通量测序原理 NGS基础 - 参考基因组和基因注释文件 NGS基础 - GTF/GFF文件格式解读和转换
肿瘤基因突变检测是NGS的一个重要应用,其分析难点主要在于低频变异的准确性。不同于遗传病检测,肿瘤样本类型多样,测序方法和参数复杂,且缺乏对应各种场景的公共标准真集。 作为NGS数据二级分析的产品专家,Sentieon推出了一系列肿瘤分析流程,适用于从组织样本到液态活检等不同场景。 作者选取了同一个组织样本的新鲜冷冻(Fresh Frozen)样本以及福尔马林固定切片(FFPE)样本进行了NGS测序,对结果数据进行肿瘤突变检测。
FASTQ文件格式和命名 高通量测序之后用于下游分析的数据一般存储在FASTQ文件中。为了节省空间,又不影响下游使用,也一般用gzip压缩的格式。 单端测序每个文库只返回一个FASTQ文件,双端测序两个FASTQ文件,左端一般命名为_1或R1,右端命名为_2或R2。 假如样品名字为ehbio,双端测序三个重复。习惯命名为ehbio_1_1.fq.gz ehbio_1_2.fq.gz, ehbio_2_1.fq.gz ehbio_2_2.fq.gz, ehbio_3_1.fq.gz ehbio_3_2.f
欢迎大家补充: 病原微生物快速定性定量 RNAseq表达量分析 CNVseq/NIPT/PGS之read计数 rRNA或其他特定序列数据库的反向过滤等 CRISPR guide RNA设计 基于kmer的NGS
GFF 文件 GFF全称为general feature format,这种格式主要是用来注释基因组。 从 Ensembl 导出的GFF文件示例: X Ensembl Repeat 2419108 2419128 42 . . hid=trf; hstart=1; hend=21 X Ensembl Repeat 2419108 2419410 2502 - . hid=AluSx; hstart=1; hend
Trimmomatic 软件可以对NGS测序数据进行质量过滤,其去除adapter的功能只是针对illumina的序列,从reads的3’端识别adapter序列并去除,相比cutadapt,少了几分灵活性
近几年来涌现了很多的软件,支持从NGS测序数据直接确定HLA Allel, HLAminer 就是其中之一。
在NGS的数据分析中,去除PCR重复序列是一个常见的分析步骤,无论是WES/WGS的snp calling,还是chip_seq, ATAC_seq,都需要对原始的bam文件进行过滤,去除其中的PCR重复序列
mats软件只要你运行成功, 结果还是喜人的, 不过目前TCGA数据库的可变剪切都是一个java软件,叫做spliceseq。我们下次再分享spliceseq咯,这次先让学徒带领大家摸索一下mats软件哈!
fastp是最近新出的一款NGS数据质量过滤工具,相比传统的QC工具,有两个主要特点,第一个就是运行速度快,第二个就是提供了质控前后数据详细统计结果。
随着测序的成本越来越低,测序技术越发先进,除了研究单核苷酸多态性(SNP)。研究者们开始慢慢将目光转向了各位复杂,但是也同样非常常见的结构变异(SV)。接下来几期推文会和大家一起学习结构变异的检测原理,然后通过一系列的实战演练和大家一起熟悉一些相关的工具和流程。
miso-lims github加速可使用:https://kfqbvpat.fast-github.tk/-----https://github.com/miso-lims/miso-lims 项目简介 适用于NGS
全外显子(Whole-exome sequencing)测序是啥?转录组(RNA-seq)测序是啥?ChIP-seq又是啥?它们之间有什么差别么?傻傻分不清,不用怕,多学习下就会了,下面让我们一起来从平均测序深度和区域覆盖度的角度来区分它们吧! 1 基础概念 平均测序深度: 指定区域内得到的所有碱基数目与该区域的长度的比值,如果是全基因组,就是整个测序的碱基数目除以基因组的大小。比如人类的基因组大小是3G(30亿个碱基),我的全基因组测序共8.9亿条150bp的reads,那么全基因组范围的平均测序深度就是