介绍RNA二级结构 对于RNA的二级结构,最直观的肯定是用图片表示,示意如下: ? 图片对于分析人员是特别直观的,但是对于软件而言,就无法识别了。 为了让程序识别RNA二级结构,专门开发出了一种表示方式,用点号和括号这两种符号来表示对应的二级结构。 该表示方法就称之为dot-bracket notation, 其核心思想是利用配对的括号来表示碱基的互补配对,用连续的点号来表示茎环结构,对于下图所示的二级结构。 ? 介绍RNA二级结构 RNApdbee 2.0: multifunctional tool for RNA structure annotation ? 使用RNApdbee2.0来注释RNA二级结构 ? 上传pdb文件,选择默认参数,点击run即可。 ? 便可以得到dot bracket格式的RNA二级结构。
trna二级结构的预测可使用RNA Structure的预测服务器 http://rna.urmc.rochester.edu/RNAstructureWeb/index.html。 例:预测爬行动物北美绿色安乐蜥的tRNA trna166-ArgTCG 的序列的二级结构 进入gtrnadb数据库查找trna166-ArgTCG 的序列 1.gtrnadb下载脊椎动物序列集,进入[Download 3.将序列文件导入到RNA Structure的预测服务器 http://rna.urmc.rochester.edu/RNAstructureWeb/index.html 进行结构预测。 进入RNA Structure界面,选择Predict a Secondary Structure ? 进入后,按要求提交数据 ? 等待得到预测的结果 ? 全文结束,欢迎在评论区讨论~
RNAComposer http://rnacomposer.cs.put.poznan.pl/ 输入RNA序列和二级结构,邮箱地址,点击compose即可。 ? 这四个rna三级结构预测的服务器网站都是需要序列和二级结构。 研究人员提出了一种快速的,基于RNA二级结构,构建RNA三级结构的自动化新方法——3dRNA。 由于RNA结构组织主要是由二级结构水平和三级作用上的拓扑约束编码决定,因此研究人员采用了一个两步法步骤,从最小的二级元件SSEs开始构建整个RNA三级结构。 具。
实验手段可用,但 RNA 的“柔性”是最大挑战 传统的蛋白结构解析技术——包括 X 射线晶体学、核磁共振(NMR)以及冷冻电镜(cryo-EM)——同样可以用于研究 RNA 结构。 受 AlphaFold 启发,RNA 结构预测迎来深度学习浪潮 AlphaFold 的成功,也极大激发了研究人员将机器学习和深度学习方法引入 RNA 结构预测。 如今,CASP 已正式纳入 RNA 结构预测任务,为该领域提供了统一、客观的评测平台。此外,RNA-Puzzles 这一长期运行的国际竞赛,也持续推动 RNA 结构预测方法的创新与对比评估。 最大瓶颈:RNA 结构数据仍然严重不足 尽管方法不断进步,RNA 结构预测仍面临一个根本性制约:高质量实验数据的匮乏。 展望:实验突破 + AI 方法,或将破解 RNA 结构密码 研究人员期待,随着实验技术的进一步发展,RNA 三级结构解析能够变得更加常规和高通量。
在 [[DNA转录过程介绍]] 介绍当中,我们知道 DNA 通过转录可以形成一条单一链的 RNA。虽然从线性角度而言的话,RNA 是单链的。但是细胞内的 RNA 可以通过折叠形成 RNA 的二级结构。 RNA 二级结构的形成在很大程度上取决于核苷酸碱基配对,包括经典碱基配对——A-U、C-G 和非 Watson-Crick 配对 G-U,以及非经典碱基配对[1]。 RNA 的二级结构除了维持 RNA 本身的稳定性之外,其也可以参与一些基因的调控作用。 因此了解一个 RNA 的二级结构还是十分重要的。 所以今天就介绍一个最近发表的基于深度学习的 RNA 二级结构预测工具。 输入完成之后,点击Submit 即可得到预测的预测的 RNA 的二级结构。 关于 RNA 二级结构的预测工具目前已经有很多了。基于 Ufold 的原始文献,作者比较了多个 RNA 二级结构预测工具。
在mirdeep软件的分析结果中,会提供miRNA前体的二级结构,这个结果实际上是通过调用RNAfold来实现的,该软件是一个经典的预测RNA二级结构的软件,网址如下 http://rna.tbi.univie.ac.at 默认参数会输出以下两种二级结构 1. optimal secondary structure 最佳二级结构,保证对应的自由能最小,最小自由能简称MFE, 结果示意如下 ? 自由能表征改变这个结构需要注入的能量大小,对应的数值越小,该结构越稳定。 同时给出了可视化结果,示意如下 ? 这个程序也是可以下载到本地运行的,基本用法如下 RNAfold < hsa.hairpin.fa -noPS > precursors.str -noPS参数代表不产生二级结构对应的postscript ,上述用法只给出了最佳的二级结构预测结果和对应的自由能。
理解其功能的机械机制需要三级结构信息;然而,实验测定RNA三维结构既昂贵又耗时,导致RNA序列和结构数据之间存在巨大差距。 NuFold还能够通过连接输入序列来预测RNA的多聚体复合物结构。 核糖核酸(RNA)是生物体的基础分子。 然而,由于实验确定的RNA结构稀缺,作者对RNA结构的了解仍然有限。蛋白质数据库(PDB)包含大约6000个条目,其中包括RNA分子,这仅占整个PDB条目的约3%。 在这里,作者介绍了NuFold,一种使用端到端深度网络架构的从头开始RNA结构预测方法。该方法接收目标RNA序列并通过一个全面训练的单一网络生成三级结构模型。 ,用于构建目标RNA的三维(3D)结构模型。
DRUGONE RNA 是细胞内关键的功能分子,其生物学作用高度依赖复杂而动态的三维结构。然而,RNA 的高度柔性、电荷特性以及对环境的敏感性,使其结构解析长期面临挑战。 近年来,随着冷冻电镜等实验技术的突破,以及受蛋白结构预测成功启发的人工智能方法兴起,RNA 结构解析进入快速发展阶段。 AI 驱动的 RNA 结构预测 受蛋白结构预测革命性进展的推动,研究人员将深度学习引入 RNA 三维结构预测。 然而,由于 RNA 结构数据稀缺、进化信号弱以及动力学信息缺失,自动化预测仍难以全面超越人工专家。 图2 | AI 驱动的 RNA 结构预测流程及典型预测示例。 未来的重要方向包括:识别并优先解析更多结构多样的新型 RNA、通过 AI 降低高分辨实验的门槛以加速结构测定流程,以及发展更具结构感知能力的 RNA 语言模型与生成模型。
(1)RNAfold 服务器 1.输入核苷酸序列 2.点击运行 RNAfold web server http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite www.unafold.org http://www.unafold.org/ 1.设置任务名 2.输入核苷酸序列 3.点击运行fold 4.点击输出页面的vienna,得到‘点括号’形式的二级结构 (4)Vfold2D服务器 Vfold2D http://rna.physics.missouri.edu/vfold2D/ 1.设置任务名 2.输入核苷酸序列,输入邮箱 3.点击运行 4.点击模型 ,生成二级结构‘点括号’ ? 服务器 CentroidFold http://rtools.cbrc.jp/centroidfold/ 1.输入核苷酸序列 2.点击运行 3.计算结束后点击txt,即可得到‘点括号’形式的二级结构
中文标题:RNA 功能决定于其结构 —— 为什么预测它如此困难? 2022年,CASP将挑战目标转向另一类复杂但极其关键的生物大分子:RNA。 RNA结构预测为何更难? 与蛋白质类似,RNA结构的解析也依赖昂贵且耗时的实验方法,而计算方法可以成为辅助工具。 科学家希望通过解析RNA的三维结构来揭示其功能机制,体现“结构决定功能”的生物学经典理念。 正如李喻所说:“在生物学中,我们假设序列决定结构,结构决定功能。” 结构预测:蛋白质遥遥领先 RNA结构预测工具的发展远落后于蛋白质。即便是AlphaFold的最新版本 AlphaFold3,在RNA结构预测方面表现也十分有限。 RNA结构的特殊挑战 与蛋白质相比,RNA分子具有更灵活的骨架,且结构更加动态,在完成功能时可能发生显著构象变化。
ERNIE-RNA 的注意力图在零样本条件下即可显著捕捉 RNA 的结构特征,甚至优于传统计算方法,说明模型在预训练过程中自然学会了 RNA 的结构模式。 RNA 不仅承担遗传信息的传递功能,还参与调控、结构构建等多种生物过程。RNA 的一级序列会折叠形成稳定的二级与三级结构,这些结构最终决定其功能。 因此,理解 RNA 结构是推动生物学与 RNA 疗法发展的关键。 预训练阶段已自然形成结构感知能力 注意力图的 RNA 二级结构零样本预测性能 研究人员将注意力图直接视为碱基配对概率矩阵,用于零样本 RNA 二级结构预测。 ERNIE-RNA 在伪结等复杂结构上的表现 伪结等复杂结构通常难以被传统热力学方法捕捉。ERNIE-RNA 通过注意力图仍能识别关键互补区域,对复杂结构的预测效果显著优于 RNA-FM 等模型。
然而,现有RNA语言模型多基于大规模序列数据进行训练,未充分利用结构信息,导致对结构相关功能的预测能力有限。 已有方法尝试引入结构特征,但往往依赖噪声较大的结构注释数据,或在训练过程中引入任务特定的监督信号,从而牺牲了模型的泛化性和通用性。这一局限性在RNA结构预测、结构导向的功能推断等领域尤为突出。 f, g 在 CASP15(12 条 RNA)和 RNA Puzzles(20 条 RNA)数据集上,基于预测三级结构提取的二级结构头对头比较。圆圈大小依差值大小而定。 j, k CASP15 和RNA Puzzles 上预测三级结构示例,原生结构以粉色展示。 图 4结构预测可视化 structRFM预测结构与 CASP15 数据集原生结构的可视化。 创新点 首次将结构引导掩码策略规模化应用于 RNA 基础模型自监督预训练; 构建迄今最大规模的 RNA 序列–结构配对数据集; 模型、数据、代码全部开源,推动多模态生物基础模型发展; 多任务性能领先,实现跨域泛化
研究人员提出 SMRTnet,一种无需 RNA 三级结构、仅基于 RNA 二级结构的小分子–RNA 相互作用预测深度学习框架。 相较于蛋白质,RNA 靶点在药物开发中仍处于早期阶段,其中一个关键瓶颈在于 RNA 三级结构难以通过实验手段大规模解析。 因此,亟需一种摆脱 RNA 三级结构依赖、可扩展至大规模 RNA 靶点的预测方法。 RNA 二级结构与模型组件的重要性 消融实验表明,RNA 序列与二级结构信息对预测性能至关重要;移除二级结构会显著降低模型表现。多模态融合模块也对整体性能提升具有重要贡献。 讨论 SMRTnet 提供了一种不依赖 RNA 三级结构的小分子–RNA 相互作用预测新范式,显著扩展了可计算研究的 RNA 靶点空间。
对于预测到的novel miRNA,也就是新的miRNA, 我们会想要知道其二级结构。对于RNA的二级结构,最直观的肯定是用图片表示,示意如下 ? 上图表示的是一个miRNA前体,即pri-miRNA, 有一个典型的茎环结构,除此之外,其他的碱基都是互补配对的。 图片对于分析人员是特别直观的,但是对于软件而言,就无法识别了。 为了让程序识别RNA二级结构,专门开发出了一种表示方式,用点号和括号这两种符号来表示对应的二级结构。 该表示方法就称之为dot-bracket notation, 其核心思想是利用配对的括号来表示碱基的互补配对,用连续的点号来表示茎环结构,对于下图所示的二级结构 ? 这种表示方式只采用了两种符号,而且都是计算机可以识别的符号,所以软件也可以识别,在很多软件和数据库中,给出的二级结构都会用这种方式来表示。 ·end· —如果喜欢,快分享给你的朋友们吧—
研究人员提出 SMRTnet,一种无需 RNA 三级结构、仅基于 RNA 二级结构的小分子–RNA 相互作用预测深度学习框架。 相较于蛋白质,RNA 靶点在药物开发中仍处于早期阶段,其中一个关键瓶颈在于 RNA 三级结构难以通过实验手段大规模解析。 因此,亟需一种摆脱 RNA 三级结构依赖、可扩展至大规模 RNA 靶点的预测方法。 RNA 二级结构与模型组件的重要性 消融实验表明,RNA 序列与二级结构信息对预测性能至关重要;移除二级结构会显著降低模型表现。多模态融合模块也对整体性能提升具有重要贡献。 讨论 SMRTnet 提供了一种不依赖 RNA 三级结构的小分子–RNA 相互作用预测新范式,显著扩展了可计算研究的 RNA 靶点空间。
简读分享 | 赵晏浠 编辑 | 陈兴民 论文题目 Long-read single-molecule RNA structure sequencing using nanopore 论文摘要 RNA 分子可以形成可以调节其定位和功能的二级和三级结构。 尽管最近使用长读长测序来确定 RNA 结构,但这些方法仍然使用跨链的聚合信号来检测结构。对总体进行平均还意味着只能获得有关分子间结构异质性或每个分子内依赖性的有限信息。 在这里,我们提出了单分子结构测序 (SMS-seq),它将结构探测与天然 RNA 测序相结合,通过新的分析方法提供单个分子的非扩增结构图谱。我们使用互信息的新方法支持单分子结构询问。 每个 RNA 在多个碱基上进行探测,从而能够发现结构特征的依赖性和异质性。我们还表明,SMS-seq 可以捕获三级相互作用、核糖开关配体结合的动力学和 mRNA 结构特征。
从而实现了在多种亚细胞组分中对RNA二级结构特征及其动态变化的系统性检测,并在单细胞水平揭示了胞浆RNA结构的异质性。 论文简介 RNA不仅是遗传信息的载体,其折叠形成的复杂二级、高级结构对于RNA在细胞内的加工成熟、定位转运及功能行使至关重要。RNA结构在生命过程中呈现高度动态变化,与RNA的命运紧密关联。 马丽佳研究员: 本研究开发的TAS-seq方法能够高通量地同时检测RNA的亚细胞定位和结构,从空间维度深入认识RNA结构的动态变化。 马丽佳研究员: 本研究丰富了对RNA结构在不同亚细胞组分动态变化的认识,发现了RNA结构组分特异性和细胞间RNA结构异质性,及其与RNA功能的密切关系,极大丰富了RNA结构动力学的认知维度。 此外,该技术框架理论上可适配多种定位信号/调控蛋白,未来有望应用于不同生理/病理状态、更多亚细胞结构的RNA动态结构研究,将强力推动RNA结构-功能关系领域的进展,并应用于指导RNA药物的分子设计。
不过对于处理后的数据集我们可以可视化一下nFeature_RNA和nCount_RNA来辅助进行质控 那首先我们基于Seurat官网的教程来了解回顾一下nFeature_RNA和nCount_RNA,并且可视化判断一下阈值 :每个细胞的UMI数目 nFeature_RNA:每个细胞所检测到的基因数目 可以看到nCount_RNA和nFeature_RNA还是有差异的,这就与它们的计算方法有关 #nCount_RNA:总的UMI 可以使用小提琴图来简单可视化一下nFeature_RNA和nCount_RNA VlnPlot(pbmc, features = c("nFeature_RNA", "nCount_RNA")) 过滤前 我们还是先重点看看nFeature_RNA和nCount_RNA #qc.R脚本中nFeature_RNA和nCount_RNA部分内容 feats <- c("nFeature_RNA", "nCount_RNA 除了在基本质控环节我们会可视化一下细胞中nFeature_RNA和nCount_RNA的情况,在进行降维聚类分群的时候,我们也会对nFeature_RNA和nCount_RNA进行可视化。
虽然RNA是单链结构的,但在我们的身体里,RNA中的部分碱基往往会相互配对,形成复杂的二级结构。如图一所示,一条长长的RNA单链,其内部互相配对形成复杂的网络结构。 ? 图一 RNA的二级结构 (via Wikipedia) 那么,如果给定了某个RNA的碱基顺序,又应该如何来预测该RNA的二级结构呢? 第二,动态规划算法计算的结果往往不是完全正确的,因为现实中RNA的二级结构可以颇为复杂。比如图二中,两个环之间的碱基又互相配对,形成复杂的三维结构。 ? 实验 ---- 本文在ArchiveII及RNAStralign两个数据集,共10类30451种RNA结构上进行了实验。 图八 各种RNA二级结构 下面我们选取文中的一个RNA实例,看看E2Efold和其他极限模型都给出了什么样的结果。 ? 这是该RNA的真实二级结构 ? 这是E2Efold模型给出的预测结果 ?
就像选择性剪接RNA或长非编码RNA一样,尽管这些非规范嵌合RNA作为一种现象在正常生理学中很常见,但它们可能在癌症中翻译出错。 首先,我们将总结嵌合RNA的类别和术语,以便更好的从机制的角度研究嵌合RNA 。然后,我们将仔细研究当前新型嵌合RNA作为肿瘤标志物的临床用途和潜在意义。 最后,我们将概述嵌合RNA促进肿瘤发生的机制以及当前融合基因作为治疗靶点的用途。 2. 嵌合RNA的分类 嵌合RNA的定义是来自两个最初分离的基因的RNA序列杂交后的转录产物。 因此嵌合RNA可以通过不同的机制产生,如融合基因转录或基因间剪接。在这一章节中,我们将从嵌合RNA的生物发生途径上分类描述它们。 嵌合RNA的形成机制。 最近一项在GTEx数据库中对正常组织中反复发生的嵌合RNA进行的研究中,发现cis-SAGe嵌合RNA占了这些RNA的很大一部分[14]。