首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信技能树

    【直播】我的基因组 45:SNV突变(6种)频谱的制作

    突变频谱呢,就是对含有SNV的VCF格式的文件进行一个统计。 全基因组SNP突变可以分成6类(C>A, C>G, C>T, A>C, A>G, A>T)。肯定会有人问为什么是六类? 以A:T>C:G为例,此种类型SNP突变包括A>C和T>G。 由于测序数据既可比对到参考基因组的正链,也可比对到参考基因组的负链,当T>C类型突变出现在参考基因组正链上,A>G类型突变即在参考基因组负链的相同位置,所以将T>C和A>G划分成一类,换句话说我们只考虑正链的突变形式 所以全基因组SNP突变可以分成这6类。 很明显,我们只需要考虑VCF文件的第4,5行即可! realign.vcf |grep -v INDEL |grep -v "^#" |cut -f 4,5|sort |uniq -c |grep -v "," 我们过滤掉了多种变异形式的SNV,比如T,突变

    3.8K70发布于 2018-03-08
  • 来自专栏作图丫

    NATURE|人类突变特征

    背景介绍 单个癌症基因组的突变可能是由多个突变过程产生的,因此包含了多个叠加的突变特征。 因此,为了系统地描述导致癌症的突变过程,曾使用数学方法从体细胞突变目录中解释突变特征,并用每个特征产生的概率注释每个肿瘤中的每个突变类。 对于SBSs,主要分类由96类组成 (available at https://cancer.sanger.ac.uk/cosmic/signatures/SBS),6种碱基替代(C>A, C>G, C ID6和ID8特征主要是≥5-bp删除(图2)。ID6展现出在缺失边界的重叠微同源,与SBS3(归因于基于同源重组的缺陷修复)相关。 这些通常伴随着SBS6、SBS14、SBS15、SBS20、SBS21、SBS26和/或SBS44,它们与DNA错配修复缺陷有关,有时与POLE 或POLD1校对缺陷(SBS14和SBS20)结合。

    2.9K20编辑于 2022-03-29
  • 来自专栏作图丫

    deconstructSigs 突变 Signature 分析

    面对大量的SNV突变数据你是否还觉得无从下手,不知道怎么分析合适?今天给大家介绍一个R包-deconstructSigs。这款R包是基于大样本量预测的signature解析突变特征。 C A 3 1 chr1 1854885 G C 4 1 chr1 9713992 G A 5 1 chr1 12908093 C A 6 sample.id # 突变文件中的样品列名 chr # 突变文件中的染色体列名 pos # 突变文件中的突变位置列名 ref # 突变文件中的参考基因组碱基列名 alt # 突变文件中的突变碱基列名 TRUE, tri.counts.method = 'default') whichSignatures参数释义 tumor.ref # 上一步生成突变文件 ,数据为数据框或文本,横行是样本,纵行是突变碱基上下文序列 sample.id # 样品名称,tumor.ref文件的行名 signatures.ref # 预测的已知signatures参考文件

    1.7K30编辑于 2022-03-29
  • 来自专栏用户7627119的专栏

    基因突变类型

    如果按照DNA碱基顺序改变的类型区分,突变还可以分为碱基置换突变、移码突变、整码突变、染色体错误配对和不等交换4种。 1.碱基置换突变 一个碱基被另一个碱基取代而造成的突变称为碱基置换突变。 根据碱基置换对肽链中氨基酸顺序的影响,可以将突变分为同义突变、错义突变、无义突变和终止密码突变4种类型。 此外,还有抑制基因突变。如果基因内部不同位置上的不同碱基分别发生突变,使其中一次突变抑制了另一次突变的遗传效应,这种突变称为抑制基因突变(suppressor gene mutation)。 例如,在血红蛋白异常疾病中, Hbharlem是β链第6位谷氨酸变成缬氨酸,第73位天冬氨酸变成天冬酰胺,但患者的临床表现较轻;而单纯β6谷氨酸缬氨酸,通常产生严重的临床症状,甚至造成死亡。 这说明 Hb harlem即β73的突变抑制了β6突变的有害效应。

    2.1K10编辑于 2022-09-21
  • 来自专栏生信修炼手册

    TMB:肿瘤突变负荷简介

    肿瘤突变负荷 tumor mutation burden, 简称TMB,代表蛋白编码区的非同义突变分布的密度,用蛋白编码区的非同义突变位点总数除以蛋白编码区的总长度, 单位为mutations/mb。 肿瘤的发生是体细胞突变引起的,体细胞在致癌因子的作用下发生基因突变,部分突变细胞经过DNA自我修饰恢复正常,一部分细胞死亡,还有部分突变细胞在其表面表达出新的抗原。 正常情况下下,机体的免疫系统可以识别这些抗原,然后通过免疫应答反应来清楚这些突变的细胞,但是肿瘤细胞可以通过抗原的异常表达或者肿瘤微环境的调节,来实现免疫逃逸,继续分裂生长,形成肿瘤。 TMB的概念中只针对了蛋白编码区的非同义突变,因为只有这些突变才有可能使得肿瘤细胞产生新抗原。 将TMB划分为以下3个层级 low TMB : 1-5 mutations/mb intermediate TMB : 6-19 mutations/mb high TMB : > 20 mutations

    2.7K31发布于 2019-12-19
  • 来自专栏生信技能树

    突变位点生存分析

    一个简单突变位点做生存分析居然拖了一两个月才有人提交笔记! 前面的题目见:学徒作业-两个基因突变联合看生存效应 (2020-04-26出题),下面看其中一个学徒的答案哦,同时也欢迎大家继续提交笔记给我哈,有机会认识我! 加油哈,广大粉丝们 1 主要流程 1.本次选用BRCA的maf数据和临床数据,主要使用其中的varscan数据 2.使用R包maftools读取maf文件,并可视化top10突变基因 3.选取两基因对BRCA Desktop\\微信公众号\\学徒作业\\test_1\\maf\\gdc_download_20200427_034400.797422.tar\\gdc_download_20200427_034400\\6c93f518 -1956-4435-9806-37185266d248\\TCGA.BRCA.varscan.6c93f518-1956-4435-9806-37185266d248.DR-10.0.somatic.maf.gz

    1.9K31发布于 2020-06-19
  • 来自专栏作图丫

    研究癌细胞系的突变特征揭示APOBEC突变的周期性

    多个突变特征 (SBS6, SBS14, SBS15, SBS20, SBS21, SBS26)被认为与错配修复(MMR)缺陷有关。 (Figure 6B)。 突变特征揭示了POLE相关的SBS10a-b/SBS28和SBS4分别只存在细胞系ESS-1和G-292-clone-A141B1中 (Figure 6A)。 此外,在肺腺癌细胞系NCI-H2087的单细胞中未检测到与吸烟相关的SBS4,但该特征在培养基序列中存在 (Figure 6A)。因此,在单细胞中检测到的突变特征表明APOBEC还在继续突变。 Figure 6:单细胞的突变特征表明了APOBEC相关的持续突变。(A)条形图表示全基因组排序的细胞系及其单细胞中碱基替换的数量(左)和突变特征(右)。

    1.8K20编辑于 2022-03-29
  • 来自专栏作图丫

    基因突变棒棒糖图,让你的突变作图美起来!

    这是一个R包,名字叫做“G3viz”,是一个专门绘制基因突变的棒棒糖图的。先来看一下颜值,你觉得OK呢再接着往下看。 是不是很OK? 怎么样才能画出这么高颜值的棒棒糖图呢?小编这就进入正题。

    3.5K10编辑于 2022-03-29
  • 来自专栏气象学家

    气象水文突变检验及Python的实现:MK、Pettitt、BUT、SNHT、BG突变点检测

    来源:气象水文科研猫 1.Mann-Kendall突变点检测: # Mann-Kendall突变点检测 # 数据序列y # 结果序列UF,UB #---------------------------- sqrt(Var) # ------------------------------逆序列计算 # 此时上一步的到UBk表现的是逆序列在逆序时间上的趋势统计量 # 与UFk做图寻找突变点时 [+1.96,+1.96],'m--',color='r') plt.legend(loc=2) # 图例 plt.show() return K ---- 2.Pettitt突变点检测 Uka = list(np.abs(Uk)) U = np.max(Uka) K = Uka.index(U) pvalue = 2 * np.exp((-6 ':K,'突变程度':change_point_desc} return K #,Pettitt_result ---- 3.Buishand U test突变点检测: def Buishand_U_change_point_detection

    8.6K36编辑于 2022-06-13
  • 来自专栏作图丫

    突变特征可视化--sigminer

    背景介绍 癌症基因组在其生命周期中由各种突变过程形成,这些过程源于外源性和细胞固有的DNA损伤,以及容易出错的DNA复制,产生了特征突变谱,称为突变特征。 obj, sig_db = "SBS") if (require(pheatmap)) { pheatmap::pheatmap(sim$similarity) } 小编总结 作为最新发布的突变特征提取和可视化

    1.1K20编辑于 2022-03-29
  • 来自专栏用户7627119的专栏

    肿瘤新抗原突变负荷分析

    6)统计分析 分类数据使用Fisher’s exact检验,连续数据使用Wilcoxon test (Mann–Whitney test)检验, log-rank检验绘制KM曲线,Cox回归分析计算hazard 所有突变基因在NAL亚组中体细胞突变的频率不同(FDR < 0.05)。 接下来评估了30个突变特征,以更好地理解复杂的突变过程。得到5个差异显著的特征,分别是特征1、特征3、特征6、特征13和特征30(图2B)。 NAL-H在特征6中富集,改特征与DNA错配修复缺陷有关,表明对检查点抑制剂敏感。 基于6种化学药物的预测模型,估计了每个泛妇科肿瘤样本的IC50。确定了所有这些化疗药物亚组的IC50估计数的显著差异。NAL-H和NAL-M对这六种药物可能比NAL-L更敏感。

    3.5K41发布于 2020-08-05
  • 来自专栏生信菜鸟团

    使用 sigminer 进行突变模式分析

    突变模式分析(Mutual Signature Analysis)已经逐步成为变异检测后一个通用分析,本文简单介绍如何使用sigminer进行突变模式分析,以解决2大分析任务: 从头发现签名 已知一些参考 如果你会使用maftools读入突变数据,那么就会使用sigminer读入突变数据,支持 data.frame 和MAF文件。 使用 sig_tally() 对突变进行归类整理,针对MAF对象,支持设置 mode 为'SBS','DBS','ID'以及'ALL'。 #> $ SBS_6 : int [1:193, 1:6] 1 0 0 2 1 0 1 1 2 2 ... #> ..- attr(*, "dimnames")=List of 2 该算法会生成更大的稀疏(相互之间相互)的签名,因此偏向于生成更多的从我多年研究签名的经验来看,它对于单点突变还是非常友好的。

    2.3K21发布于 2020-06-10
  • 来自专栏生信菜鸟团

    使用MutsigCV预测驱动突变基因

    写在前面 首先,突变的分类方法有很多种,按照其是否会导致癌症进展,可以分为驱动突变(driver mutation)和乘客突变(passenger mutation)。 前者在肿瘤细胞中具有选择性生长优势的突变,后者对肿瘤细胞的选择性生长优势无直接或间接影响的突变。 目前来说,推断驱动突变的算法有很多,可以参考这篇综述:https://academic.oup.com/bib/article/17/4/642/2240387。总的来说,可以分为以下 5 种: ? /data/chr_files_hg38.txt 运行 最后运行代码,即可获取驱动突变分析结果: cd ~/wes_cancer/project .. n_silent n_noncoding nnei x X p q KIAA0040 NaN NaN NaN 17208 4392 0 8 0 0 31 6

    8.1K51发布于 2020-05-24
  • 来自专栏医学数据库百科

    突变对蛋白功能影响预测

    基因突变对于基因功能的影响是多种多样的。有的突变会改变蛋白的功能,这类改变蛋白功能的突变对于整个基因而言则更加重要一些。我们在肿瘤治疗当中,有的药物是基因蛋白功能起作用的。 来观察突变对于潜在功能的影响。 ? 数据输入选项 AlloDriver在进行分析之前,需要输入三个数据参数。分别是: 工作ID: 这个方便我们来再次查看结果 突变的相关数据:数据库的主体。 突变的相关数据 这个地方我们需要放入想要检索的数据结果。它接受三种输入方式分别是: TXT文本格式: 需要包括三列(样本ID, 基因名;突变位点)。三列之间通过分号来连接。 ? 表格结果 表格结果当中包括了基因名、突变位置、突变的位置等等。 ? 我们点击SHOW可以查看关于这个基因的突变的3D图; 所有结果在泛肿瘤突变的情况;突变在基因中的位置; 以及作用在这个位点的药物。 ?

    2.3K20发布于 2020-06-01
  • 来自专栏生信菜鸟团

    用 VEP 注释突变数据

    :Ensembl stable ID of feature6.Feature type :feature 类型,包括 Transcript,RegulatoryFeature,MotifFeature 6. 将输入文件按染色体进行排序。7. (包括 dbSNP)注释突变名称。 默认情况下,VEP 用基于归一化的等位基因来匹配数据库以识别与输入突变相匹配的已知突变。 ? VEP 等位基因匹配算法示意图,该算法会将一条带有多个 ALT 的 VCF 记录解析为三种不同的突变类型和坐标。 ----

    6.6K20发布于 2020-04-28
  • 来自专栏新智元

    Nature封面6连发:奥密克戎突变凶猛,疫苗效力大减,为什么?

    ---- 新智元报道   编辑:David 时光 【新智元导读】奥密克戎继续肆虐全球,最新一期Nature封面连发6文,详细揭示奥密克戎变种毒株是如何逃避现有疫苗,并以惊人速度传播开来。 今天,Nature封面刊题《奥密克戎和抗体》,集纳6篇与此主题相关论文,对奥密克戎与抗体问题进行专题研究。 奥密克戎是如何「逃避」疫苗抗体的? 但随着冠状病毒的进化以逃避免疫系统,这个蛋白成为病毒突变的温床。 比如,Omicron在其穗状蛋白中有几十个新的突变。 研究人员认为,这些突变可能就是让治疗高毒性的Delta变体的两种单克隆抗体鸡尾酒疗法对Omicron无能为力的原因。 他说,就像疫苗一样,当病毒发生进化和突变时,抗体治疗可能会变得不那么有效。

    35620编辑于 2022-03-04
  • 来自专栏生信修炼手册

    SomamiR:肿瘤体细胞突变影响miRNA结合的突变位点数据库

    在基因组层面,包括了以体细胞突变为主体的多种基因组变异研究,在转录组层面,包括以ceRNA调控网络为制高点的多项分析内容。 以直接位于miRNA基因区域的体细胞突变位点为例,检索框如下 ? 可以选择对应的肿瘤类型,检索结果示意如下 ? 会给出CLASH数据分析得到的miRNA结合位点,和位于该区域内的体细胞突变的详细信息。 除了直接提供肿瘤相关的体细胞突变位点外,为了更好的研究其功能,还提供了对应的这些突变位点所在基因参与的pathway信息,示意如下 ? 同时还从文献中收集整理了增加患病风险的突变位点信息, 结果示意如下 ? 该数据库将基因组变异和转录组联系起来的分析思路值得我们借鉴。

    56710发布于 2019-12-19
  • 来自专栏生物信息学、python、R、linux

    SCmut||分析单细胞数据突变

    但目前DNA测序中检测突变的方法多种多样,尚不清楚这些方法是否可以用于scRNA-seq数据。 对Bulk RNAseq或scDNA-seq数据开发的突变检测方法不适用于scRNA-seq数据,因为它们会产生过多的假阳性。 在scRNA-seq乳腺癌数据集中,SCmut可以识别许多高度可信的细胞水平突变,这些突变在许多细胞中都反复出现,并且在不同样品中保持一致。 简而言之,该方法首先从肿瘤和匹配的种系组织的大细胞DNA测序(bcDNA-seq)中收集体细胞突变。 在(i)中,发现的细胞水平突变在肿瘤细胞和非肿瘤细胞之间被很好地分开,在(ii)中,突变被同时在两个独立的数据集中发现。

    1.2K10发布于 2020-09-03
  • 来自专栏作图丫

    MutationalPatterns--进行肿瘤突变分析!

    背景介绍 突变过程在基因组 DNA 中留下特征足迹。 涵盖了广泛的模式,包括:突变特征、转录和复制链偏差、病变分离、基因组分布以及与基因组特征的关联,这些对于研究突变过程的活动具有共同意义。 R包安装 if (! 突变谱显示了每个突变类型在碱基替换目录中的相对贡献。 plot_spectrum 函数绘制 6 种碱基替换类型中每一种对所有样本的平均相对贡献。误差线表示所有样本的 95% 置信区间。 ,可用于可视化基因组或染色体子集的突变分布。

    1.6K21编辑于 2022-03-29
  • 来自专栏医学数据库百科

    临床相关突变查询数据库

    写在前面 越来越多的研究发现某一个基因的突变和很多的临床特征有关系。如果我们想有查找临床性状和基因突变的关系的话,内容比较全面的就是ClinVar数据库了。 ClinVar 数据库是ncbi旗下用于查看临床相关突变的数据库。但是其数据库的内容比较多,而且检索界面不是很友好。所以经常看不懂其结果。所以今天就介绍一个检索简单的突变和表型的数据库。 输入 数据库的输入很简单,我们可以数据疾病;基因名; 突变等。都可以。 我这里输入gastric cancer。 例如点击genes就可以看到三个相关的突变基因都是哪三个了。 另外数据库也提供了下载的功能。我们点击Show Table就可以看到其下载结果的地方了。 写在后面 以上就是这个数据的所有功能的。

    1.3K40发布于 2021-11-18
领券