首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏作图丫

    NATURE|人类突变特征

    这些可能分别代表胞苷脱氨酶APOBEC3A和APOBEC3B的活性。如果是这样的话,在APOBEC活性高的癌症中,APOBEC3A比APOBEC3B有更多的突变。 SBS特征在发现它们的癌症类型和癌症样本的数量以及每个癌症样本归因的突变中显示了显著的变化(图3)。几乎所有个体癌症样本都显示了多个特征,在PCAWG集合中模式为3 。 ID3的主要特征是短(≤5 bp长)单核细胞胞嘧啶重复缺失,并在与吸烟有关的肺癌、头颈部癌症中显示出数百种突变(图2,3)。 ID3突变的数量与SBS4和DBS2突变的数量正相关,已经表明这与吸烟有关,因此,烟草烟雾成分造成的DNA损伤可能是ID3的基础。 一小部分癌症表现出大量的ID1和ID2突变(> 10000)(图3)。

    2.9K20编辑于 2022-03-29
  • 来自专栏作图丫

    deconstructSigs 突变 Signature 分析

    面对大量的SNV突变数据你是否还觉得无从下手,不知道怎么分析合适?今天给大家介绍一个R包-deconstructSigs。这款R包是基于大样本量预测的signature解析突变特征。 sample.mut.ref) Sample chr pos ref alt 1 1 chr1 905907 A T 2 1 chr1 1192480 C A 3 sample.id # 突变文件中的样品列名 chr # 突变文件中的染色体列名 pos # 突变文件中的突变位置列名 ref # 突变文件中的参考基因组碱基列名 alt # 突变文件中的突变碱基列名 TRUE, tri.counts.method = 'default') whichSignatures参数释义 tumor.ref # 上一步生成突变文件 ,数据为数据框或文本,横行是样本,纵行是突变碱基上下文序列 sample.id # 样品名称,tumor.ref文件的行名 signatures.ref # 预测的已知signatures参考文件

    1.7K30编辑于 2022-03-29
  • 来自专栏用户7627119的专栏

    基因突变类型

    根据碱基置换对肽链中氨基酸顺序的影响,可以将突变分为同义突变、错义突变、无义突变和终止密码突变4种类型。 例如,DNA模板链中GCG的第3位G被A取代而成GCA,则mRNA中相应的密码子CGC就被转录为CGU,由于CGC和CGU都是精氨酸的密码子,因而新形成的肽链没有氨基酸顺序和数目的变化,这种突变称为同义突变 例如,mRNA的正常编码顺序为:UAU(酪)GCC(丙)AAA(赖)UUG(亮)AAA(赖)CCA(脯),当第3个氨基酸对应的密码子中间的A颠换为C时,则AAA(赖)ACA(苏),即上述顺序改变为UAU 2.移码突变 移码突变(frame-shift mutation)是指DNA链上插入或缺失1个、2个甚至多个碱基(但非3个碱基或3的整数倍的碱基),导致在插入或缺失碱基部位以后的密码子顺序和组成发生相应改变 3.整码突变 如果在DNA链的密码子之间插入或缺失一个或几个密码子,则合成的肽链将增加或减少个或几个氨基酸,但插入或缺失部位前后的氨基酸顺序不变。

    2.1K10编辑于 2022-09-21
  • 来自专栏生信修炼手册

    TMB:肿瘤突变负荷简介

    肿瘤突变负荷 tumor mutation burden, 简称TMB,代表蛋白编码区的非同义突变分布的密度,用蛋白编码区的非同义突变位点总数除以蛋白编码区的总长度, 单位为mutations/mb。 肿瘤的发生是体细胞突变引起的,体细胞在致癌因子的作用下发生基因突变,部分突变细胞经过DNA自我修饰恢复正常,一部分细胞死亡,还有部分突变细胞在其表面表达出新的抗原。 正常情况下下,机体的免疫系统可以识别这些抗原,然后通过免疫应答反应来清楚这些突变的细胞,但是肿瘤细胞可以通过抗原的异常表达或者肿瘤微环境的调节,来实现免疫逃逸,继续分裂生长,形成肿瘤。 TMB的概念中只针对了蛋白编码区的非同义突变,因为只有这些突变才有可能使得肿瘤细胞产生新抗原。 将TMB划分为以下3个层级 low TMB : 1-5 mutations/mb intermediate TMB : 6-19 mutations/mb high TMB : > 20 mutations

    2.7K31发布于 2019-12-19
  • 来自专栏生信技能树

    突变位点生存分析

    一个简单突变位点做生存分析居然拖了一两个月才有人提交笔记! 前面的题目见:学徒作业-两个基因突变联合看生存效应 (2020-04-26出题),下面看其中一个学徒的答案哦,同时也欢迎大家继续提交笔记给我哈,有机会认识我! 加油哈,广大粉丝们 1 主要流程 1.本次选用BRCA的maf数据和临床数据,主要使用其中的varscan数据 2.使用R包maftools读取maf文件,并可视化top10突变基因 3.选取两基因对BRCA 临床样本进行分组 所选取两基因都未发生突变的样本为一组 剩余样本为一组 4.使用logrank进行生存分析 2 代码及结果图 1.读取maf文件并对数据进行可视化 options(download.file.method ) meta[,3][is.empty.chr(meta[,3])]=0 meta[,4][is.empty.chr(meta[,4])]=0 meta$time=(as.numeric(meta[,3

    1.9K31发布于 2020-06-19
  • 来自专栏作图丫

    研究癌细胞系的突变特征揭示APOBEC突变的周期性

    Figure 1:癌细胞系类按字母顺序为列,突变标记为行。 02 研究癌症细胞系中的持续突变 使用多种癌症的28个细胞系 (Figure 3A)来研究多范围的特征的突变过程的活性模式。 将亲代克隆和相关子克隆的突变进行相减,得到所需要的突变集。然后生成了100个全基因组和41个全外显子序列的子克隆以及相应的58个亲本克隆的特征图谱(Figure 3)。 Figure 2 :在一段时间内追踪获取癌症细胞系的突变 Figure 3 :人类癌细胞突变过程(A-C)柱状图表示在培养基细胞系中由于突变特征和indel而导致的碱基替换的数量,以及各自的亲本(B) 培养基细胞系中存在的某些突变特征,在其后代克隆的体外培养过程中并没有产生(Figure 3),其他特征在培养某些细胞系的后代克隆时继续产生。 人类癌症中SBS2和SBS13突变主要发生在APOBEC3A诱导突变的序列。

    1.8K20编辑于 2022-03-29
  • 来自专栏作图丫

    基因突变棒棒糖图,让你的突变作图美起来!

    这是一个R包,名字叫做“G3viz”,是一个专门绘制基因突变的棒棒糖图的。先来看一下颜值,你觉得OK呢再接着往下看。 是不是很OK? 怎么样才能画出这么高颜值的棒棒糖图呢?小编这就进入正题。 /g3viz") 第二,调用“G3viz” #注意此时字母均为小写 library("g3viz") 第三,绘图 G3viz包接受三种类型的绘图文件,分别为MAF文件、CSV/TSV文件以及cbioportal title.text = "PIK3CA gene (default theme)") g3Lollipop(mutation.dat, gene.symbol = "PIK3CA "pie", chart.margin = list(left = 30, right = 20, top = 20, bottom = 30), chart.background = "#d3d3d3 = 300, # Lollipop track settings lollipop.track.height = 200, lollipop.track.background = "#d3d3d3

    3.5K10编辑于 2022-03-29
  • 来自专栏气象学家

    气象水文突变检验及Python的实现:MK、Pettitt、BUT、SNHT、BG突变点检测

    来源:气象水文科研猫 1.Mann-Kendall突变点检测: # Mann-Kendall突变点检测 # 数据序列y # 结果序列UF,UB #---------------------------- sqrt(Var) # ------------------------------逆序列计算 # 此时上一步的到UBk表现的是逆序列在逆序时间上的趋势统计量 # 与UFk做图寻找突变点时 [+1.96,+1.96],'m--',color='r') plt.legend(loc=2) # 图例 plt.show() return K ---- 2.Pettitt突变点检测 np.abs(Uk)) U = np.max(Uka) K = Uka.index(U) pvalue = 2 * np.exp((-6 * (U**2))/(n**3 ':K,'突变程度':change_point_desc} return K #,Pettitt_result ---- 3.Buishand U test突变点检测: def Buishand_U_change_point_detection

    8.6K36编辑于 2022-06-13
  • 来自专栏作图丫

    突变特征可视化--sigminer

    背景介绍 癌症基因组在其生命周期中由各种突变过程形成,这些过程源于外源性和细胞固有的DNA损伤,以及容易出错的DNA复制,产生了特征突变谱,称为突变特征。 obj, sig_db = "SBS") if (require(pheatmap)) { pheatmap::pheatmap(sim$similarity) } 小编总结 作为最新发布的突变特征提取和可视化

    1.1K20编辑于 2022-03-29
  • 来自专栏用户7627119的专栏

    肿瘤新抗原突变负荷分析

    新抗原负荷亚组的不同功能通路 对三个亚组的差异表达分析识别出5个显著差异表达基因(CXCL9、CXCL13、IGLL5、AGR3和TFF3)。 突变频率前5位基因[TP53 (48%)、PIK3CA (33%)、PTEN(22%)、ARID1A(15%)和PIK3R1(12%)],描述了它们在NAL亚组中的分布(图2A)。 接下来评估了30个突变特征,以更好地理解复杂的突变过程。得到5个差异显著的特征,分别是特征1、特征3、特征6、特征13和特征30(图2B)。 NAL-M在特征3、13和30中富集,特征3与乳腺癌、胰腺癌和卵巢癌的生殖系和体细胞BRCA1和BRCA2突变密切相关。特征13表示胞苷脱氨酶的AID/APOBEC家族活性。 新抗原负荷亚组的体细胞突变特征 三、新抗原负荷亚组与临床结果的关系 相比于NAL-M 和 NAL-L,NAL-H的生存最好(图3A)。比较了亚组之间的临床协变量的差异(表1)。

    3.5K41发布于 2020-08-05
  • 来自专栏生信菜鸟团

    使用 sigminer 进行突变模式分析

    突变模式分析(Mutual Signature Analysis)已经逐步成为变异检测后一个通用分析,本文简单介绍如何使用sigminer进行突变模式分析,以解决2大分析任务: 从头发现签名 已知一些参考 如果你会使用maftools读入突变数据,那么就会使用sigminer读入突变数据,支持 data.frame 和MAF文件。 使用 sig_tally() 对突变进行归类整理,针对MAF对象,支持设置 mode 为'SBS','DBS','ID'以及'ALL'。 我们先看一个最常见的突变模式图谱: p <- show_sig_profile(sigs, mode = "SBS", style = "cosmic") p ? 该算法会生成更大的稀疏(相互之间相互)的签名,因此偏向于生成更多的从我多年研究签名的经验来看,它对于单点突变还是非常友好的。

    2.3K21发布于 2020-06-10
  • 来自专栏生信菜鸟团

    使用MutsigCV预测驱动突变基因

    写在前面 首先,突变的分类方法有很多种,按照其是否会导致癌症进展,可以分为驱动突变(driver mutation)和乘客突变(passenger mutation)。 前者在肿瘤细胞中具有选择性生长优势的突变,后者对肿瘤细胞的选择性生长优势无直接或间接影响的突变。 m_bbv068f1p 大部分的算法,都是基于各大突变注释数据库,比如:COSMIC、TCGA、ICGC、cBioPortal、Cancer3D、dSysMap、ENCODE、NIH Epigenome ,并进行一定的比较 参考: https://captorr.github.io/2018/07/18/mutsigcv/ https://www.jianshu.com/p/c86fadbff4c3 https 1262496 1.687600e-07 1.591576e-03 FAM153A 1267336 553 18 58536 14112 0 4 0 0 50 3

    8.1K51发布于 2020-05-24
  • 来自专栏医学数据库百科

    突变对蛋白功能影响预测

    基因突变对于基因功能的影响是多种多样的。有的突变会改变蛋白的功能,这类改变蛋白功能的突变对于整个基因而言则更加重要一些。我们在肿瘤治疗当中,有的药物是基因蛋白功能起作用的。 突变的相关数据 这个地方我们需要放入想要检索的数据结果。它接受三种输入方式分别是: TXT文本格式: 需要包括三列(样本ID, 基因名;突变位点)。三列之间通过分号来连接。 ? 影响的区域 我们在进行3D蛋白绘图的时候,可以选择映射区域。这个数据库提供了两种映射的选项,分别是: 变构位点(Allosteric Site)以及功能位点(Functional Site)。 表格结果 表格结果当中包括了基因名、突变位置、突变的位置等等。 ? 我们点击SHOW可以查看关于这个基因的突变3D图; 所有结果在泛肿瘤突变的情况;突变在基因中的位置; 以及作用在这个位点的药物。 ?

    2.3K20发布于 2020-06-01
  • 来自专栏生信菜鸟团

    用 VEP 注释突变数据

    标准结果文本为 14 列,由 TAB 分割: 1.Uploaded variation :突变 ID2.Location :位置3.Allele4.Gene :基因 Ensembl ID5.Feature /vep -i my_input.vcf --fork 4 --offline 3. 用 tmpfs 将数据库写入内存。4. (包括 dbSNP)注释突变名称。 默认情况下,VEP 用基于归一化的等位基因来匹配数据库以识别与输入突变相匹配的已知突变。 ? VEP 等位基因匹配算法示意图,该算法会将一条带有多个 ALT 的 VCF 记录解析为三种不同的突变类型和坐标。 ----

    6.6K20发布于 2020-04-28
  • 来自专栏生信修炼手册

    SomamiR:肿瘤体细胞突变影响miRNA结合的突变位点数据库

    在基因组层面,包括了以体细胞突变为主体的多种基因组变异研究,在转录组层面,包括以ceRNA调控网络为制高点的多项分析内容。 以直接位于miRNA基因区域的体细胞突变位点为例,检索框如下 ? 可以选择对应的肿瘤类型,检索结果示意如下 ? 会给出CLASH数据分析得到的miRNA结合位点,和位于该区域内的体细胞突变的详细信息。 除了直接提供肿瘤相关的体细胞突变位点外,为了更好的研究其功能,还提供了对应的这些突变位点所在基因参与的pathway信息,示意如下 ? 同时还从文献中收集整理了增加患病风险的突变位点信息, 结果示意如下 ? 该数据库将基因组变异和转录组联系起来的分析思路值得我们借鉴。

    56710发布于 2019-12-19
  • 来自专栏生物信息学、python、R、linux

    SCmut||分析单细胞数据突变

    但目前DNA测序中检测突变的方法多种多样,尚不清楚这些方法是否可以用于scRNA-seq数据。 对Bulk RNAseq或scDNA-seq数据开发的突变检测方法不适用于scRNA-seq数据,因为它们会产生过多的假阳性。 在scRNA-seq乳腺癌数据集中,SCmut可以识别许多高度可信的细胞水平突变,这些突变在许多细胞中都反复出现,并且在不同样品中保持一致。 简而言之,该方法首先从肿瘤和匹配的种系组织的大细胞DNA测序(bcDNA-seq)中收集体细胞突变。 在(i)中,发现的细胞水平突变在肿瘤细胞和非肿瘤细胞之间被很好地分开,在(ii)中,突变被同时在两个独立的数据集中发现。

    1.2K10发布于 2020-09-03
  • 来自专栏作图丫

    MutationalPatterns--进行肿瘤突变分析!

    背景介绍 突变过程在基因组 DNA 中留下特征足迹。 涵盖了广泛的模式,包括:突变特征、转录和复制链偏差、病变分离、基因组分布以及与基因组特征的关联,这些对于研究突变过程的活动具有共同意义。 R包安装 if (! 突变谱显示了每个突变类型在碱基替换目录中的相对贡献。 ncol = 3, widths = c(3, 3, 1.75)) p4 <- plot_spectrum(type_occurrences, by = tissue, CT = TRUE, legend ,可用于可视化基因组或染色体子集的突变分布。

    1.6K21编辑于 2022-03-29
  • 来自专栏医学数据库百科

    临床相关突变查询数据库

    写在前面 越来越多的研究发现某一个基因的突变和很多的临床特征有关系。如果我们想有查找临床性状和基因突变的关系的话,内容比较全面的就是ClinVar数据库了。 ClinVar 数据库是ncbi旗下用于查看临床相关突变的数据库。但是其数据库的内容比较多,而且检索界面不是很友好。所以经常看不懂其结果。所以今天就介绍一个检索简单的突变和表型的数据库。 输入 数据库的输入很简单,我们可以数据疾病;基因名; 突变等。都可以。 我这里输入gastric cancer。 例如点击genes就可以看到三个相关的突变基因都是哪三个了。 另外数据库也提供了下载的功能。我们点击Show Table就可以看到其下载结果的地方了。 写在后面 以上就是这个数据的所有功能的。

    1.3K40发布于 2021-11-18
  • 来自专栏生信技能树

    TCGA体细胞突变系列教程--胃癌

    肿瘤突变分析越来越火了,一起来学习一下吧。今天和大家一起探索TCGA数据中胃癌突变的情况。 3)代码和结果 source("https://bioconductor.org/biocLite.R") chooseBioCmirror() #选择一个就近的镜像 biocLite("maftools Mutation Signature 首先了解mutation signature的概念,现在很多生信文章中提到Signature 1 ,Signature 3等,看到这个有点困惑,通读了这篇文章Signatures (不同的突变过程可以产生不同的突变类型的组合),称为“特征”。 这个概念给我的感觉是在混乱中用数学统计分析查找规律,并应用规律。 那肿瘤的突变特征如何计算呢? ,而是开始,利用这些突变可以挖掘文章探索突变以及突变特征的意义等等,写到这里我感觉把文章都告诉你怎么写了,加油吧,小伙伴们。

    10K41发布于 2018-12-07
  • 单细胞空间突变信息分析导论

    Evil Genius想想自己真的挺搞笑的,读大学的时候觉得27、28怎么着也结婚了吧,没想到混到30多去相亲了,喜欢的女孩子无一例外都把自己给踹了, ,相亲么,说真的有一种很奇怪的感觉,目前相亲了3、 ,3’数据和空转数据只能检测到基因末尾98bp的范围,5‘数据能检测到基因开始的98bp范围。 下来我们就需要了解我们的单细胞空间数据那些突变是可以检测到的有价值的突变,在文章系统整理10X单细胞空间数据中可检测到的有害突变位点(OncoKB)中,简单介绍了一个结直肠癌例子, 如果做结直肠癌的单细胞数据 ,KRAS这个基因的突变,包括Q22E、G12T、G13V、G13S、G13H、L19F、G12D等突变都在单细胞数据的检测范围之内,那么做结肠癌的单细胞数据,这些突变信息就可以考虑进去,相当于单细胞数据多了 (以单细胞3'数据为例),row是基因 + 染色体 + 位置 + ref +alt,column是barcode。

    34120编辑于 2024-04-13
领券