首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信小驿站

    查询蛋白结构

    结构域是蛋白质三级结构的基本结构单位和功能单位 蛋白质三级结构的基本结构单位是结构域。 一个蛋白质可以只包含一个结构域也可以由 几个结构域组成,故结构域是能够独立折叠为稳定的三级结构的多肽链的一部分或全部。结构域也是功能单位,通常多结构蛋白质中不同的结构域是与不同的功能相关联的。 生物体的基因组决定了所有构成该生物体的蛋白质,基因规定了蛋白质的氨基酸序列。蛋白结构域是蛋白中具有特异空间结构和独立功能的区域,是蛋白质发挥生物学效用的关键功能单位。 了解蛋白质的空间结构不仅有利于认识蛋白质的功能,也有利于认识蛋白质是如何执行其功能的。确定蛋白质的结构对于生物学研究是非常重要的。 SMART(http://smart.embl-heidelberg.de/),可以说是蛋白结构预测和功能分析的工具集合。简单点说,就是集合了一些工具,可以预测蛋白的一些二级结构

    2.3K11发布于 2020-06-05
  • 来自专栏Dechin的专栏

    蛋白质基础组成结构

    技术背景 了解蛋白质的基本组成单元和结构,有助于了解蛋白质的特性。对于蛋白结构的研究,在医药领域是非常核心的重要工作。 这里我们仅仅介绍一些蛋白质的基本组成单元——20种氨基酸的种类,以及可以用于蛋白质建模的一些工具。 HO-p-Ph-CH2-CH(NH2)-COOH 5.66 Valine 缬氨酸 Val V (CH3)2CH-CH(NH2)-COOH 5.96 PDB文件基本格式 pdb是最常用的一种存储蛋白结构的文本文件格式 总结概要 本文通过对Xponge+VMD的工具对蛋白质进行建模,然后总结了20种氨基酸的具体信息,也就是蛋白质的基本组成单元。通过对这些氨基酸的组合,就可以得到一个具有生物活性的蛋白质。 同时本文还介绍了常用的存储蛋白结构的文件格式pdb的具体格式化定义,总体来说是一个总结性的文章。

    93931编辑于 2022-05-09
  • 来自专栏DrugOne

    InstructPLM: 对齐蛋白质语言模型以遵循蛋白结构指令

    鉴于结构决定功能,结构相似的突变蛋白更有可能在生物进化中保存下来。 这些遗传变异为蛋白质工程提供了丰富的蛋白质资源。在蛋白质工程中,一个典型的挑战是蛋白质序列设计,也称为蛋白质反向折叠,它需要找到能够折叠成特定蛋白质主链结构的氨基酸序列。 模型部分 InstructPLM的整体模型架构由三个部分组成:一个蛋白质语言解码器,一个蛋白质主链编码器,一个蛋白结构到序列的adapter。 此外,作者仿照着Qwen-VL的方法,在交叉注意力中添加一维绝对位置编码,以在压缩过程中保留蛋白质一级结构信息。压缩后的蛋白质主链结构特征序列随后被送入蛋白质语言模型,作为一个软提示。 基于完全计算预测的结构生成功能性酶的能力突显了结合高级蛋白结构预测工具如AlphaFold和结构设计工具如Chroma与InstructPLM的潜力。

    44610编辑于 2024-06-04
  • 来自专栏DrugScience

    寻找蛋白结构中的紊乱残基

    紊乱残基,分析蛋白结构的时候,经常遇见的一个点,以前的,我觉得蛋白结构就是结构,唯一的稳定的,直到我亲眼遇到了几个坑。 好吧开始 用的biopython,编程语言还是python 直接代码: 我懒得排版,你们就简单看 拿个蛋白:1h10 ? 假如出现什么值得注意的地方,那事情就有点难办了 #建造一个mmcif解析器 from Bio.PDB.MMCIFParser import MMCIFParser parser = MMCIFParser() #结构输入 structure = parser.get_structure('1h10', '1h10.cif') #简单看下 structure #看下这个实例能做什么 dir(structure) #这个结构只有一个 model,不是nmr结构,只有A链一条链,残基总共357个 #(水,ligand也算残基(biopython说法应该是异质残基)) len(structure[0]['A']) #判断一个残基是否位为紊乱残基

    68120发布于 2021-02-04
  • 来自专栏DrugOne

    BIB | 动态结构信息提升蛋白-蛋白相互作用预测能力

    蛋白质的空间结构与其功能特性密切相关,在预测蛋白质-蛋白质相互作用中增加蛋白质空间结构相关信息能潜在提高模型预测能力。 本文提出TAGPPI模型,融合蛋白质序列特征与AlphaFold2预测的结构信息提高蛋白-蛋白相互作用预测精度。德睿智药团队负责了研究部分AI模型的开发与验证。 由于蛋白质的空间结构与其功能密切相关,研究团队认为针对PPI预测问题,结合蛋白结构信息,可潜在提高模型的预测性能。 然而,已知结构蛋白质数量有限,限制了基于结构的预测方法的应用,利用Alphafold2预测的蛋白结构是一种新的尝试。 随着蛋白结构预测方法的改进,三维结构在数量和质量上都会有实质性的发展,这一趋势或许将促使更多围绕结构特征的研究的开展。团队计划尝试将该策略应用于其他预测任务,如药物-靶点相互作用预测和蛋白质设计。

    1.1K20编辑于 2022-03-25
  • 来自专栏生信小驿站

    蛋白质二级结构预测

    蛋白质二级结构 ? α-螺旋(α-Helix) 蛋白质中最丰富的的二级结构 β-折叠片(β-Sheets) 具有平行(parallel)与反平行(antiparallel)两种形式 环区(Loops) 连接螺旋和折叠结构 常位于蛋白结构表面,多为带点和极性氨基酸 常为活性位点组成部分 无规则卷曲(Disordered regions) Jpred Jpred 是一种蛋白质二级结构预测网络服务器,由Barton Group 通过提交单一蛋白质序列或多重蛋白质序列并运行,Jpred就可以预测出蛋白质序列的二级结构:α-螺旋、β-折叠或无规则卷曲。Jpred应用了Jnet神经网络算法,准确率达到了76.4%。 (windows)输入神经网络进行二级结构预测。

    1.6K01发布于 2020-07-14
  • 来自专栏生信小驿站

    蛋白结构学习记录1

    β-Strands (β-Sheets)  一般不单独出现,成对或多个出现  β链通过氢键相互作用,稳定结构  通过β转角,短或长的loop、coil或α螺旋连 接序列相邻的两个β片。  平行或反平行的β−sheet Loop 连接α-helix或β-sheet 长度和三级结构不确定 在蛋白结构的表面 受点突变的影响小 柔性好,构象变化余地大 带电荷、极性的氨基酸比例高 维系蛋白结构的作用力 氢键: 与电负性大的原子X(氧、氮等)共价结合 的氢,如与负电性大的原子Y接近,在X与Y之间以 氢为媒介,生成X-H…Y形的键。有饱和性和方向 性。 盐键(离子键): 是蛋白质分子中带正、负电荷 的侧链基团互相接近,通过静电吸引而形成,作 用力强,无饱和性,无方向性。 一般认为折 叠过程中不介导蛋白形成正确构象,但加固已形 成的折叠结构。 金属配位键: 金属离子与蛋白特定残基形成。 1,蛋白质的正确折叠所必须; 2,正确折叠过程非必须,但有利于结构稳定。

    85420发布于 2020-10-28
  • AlphaFold破解心脏病关键蛋白结构

    揭示心脏病关键蛋白结构,长期以来既是重要的公共卫生目标,也是一个棘手的科学难题。 揭示其关键蛋白结构,有望阐明坏胆固醇如何在体内产生危害,为科学家预防和治疗ASCVD提供更优策略。AlphaFold在此项工作中发挥了核心作用。 他利用AlphaFold生成了该蛋白结构的原子级精度预测,然后通过与冷冻电镜图像数据进行比对,对这些预测结构进行了优化。 最终生成的模型以前所未有的细节揭示了坏胆固醇关键蛋白结构:一个环绕每个LDL颗粒的笼状外壳,其中包含一条带状结构,确保颗粒在血液中的完整性。 他说:“AlphaFold上线那周,这是我第一个用它来运算的结构,也是我第一个想用我们那台两层楼高的冷冻电镜去观察的蛋白质。解析apoB100的结构,梦想成真了。”FINISHED

    11010编辑于 2026-02-13
  • 来自专栏DrugOne

    结构感知的蛋白质预训练

    这篇文章设计了针对蛋白结构的预训练任务,并运用双层优化和互信息捕捉序列信息和结构信息的一致性,在下游任务上取得了当前最好的结果。 现有蛋白质表征学习的主要阻碍是有监督数据太少,而最近的一些研究已经证明了自监督学习有希望解决标签不足这个问题。然而,现有蛋白质自监督学习方法只作用在蛋白质序列层面,没有显式考虑蛋白结构的信息。 为此,作者提出了一种新的蛋白质自监督学习方法来有效地捕捉蛋白质的结构信息。具体来讲,基于残基间距离和二面角设计了两个自监督学习任务并使用图神经网络来捕捉这些信息。 更进一步,作者利用预训练好的蛋白质语言模型增强蛋白结构的自监督学习,并且提出一种伪双层优化方案去保证蛋白质序列信息和结构信息的一致性。下游任务的实验验证了作者提出的方法的有效性。 基于图神经网络的两个自监督任务很好地捕捉蛋白质的结构信息,同时,伪双层优化保证了蛋白质序列信息和结构信息的一致性。下游任务C2, C10和C384的结果验证了方法的有效性。

    28230编辑于 2022-11-28
  • Science|蛋白质-蛋白质相互作用的结构发生机制

    利用合成共进化设计从头界面 图1 合成共进化工作流程 (A)界面迁移策略概述:蛋白质Z结构域和亲和体的经典结合界面(H1-H2)被迁移至非经典H2-H3和H1-H3表面,以创建新的合成界面。 ;NGS数据还通过统计机器学习(ML)方法建模多轮筛选数据,以获得估算的适应度景观,该景观可通过模拟共进化轨迹揭示景观几何结构,并通过上位性分析阐明关键蛋白质-蛋白质相互作用;Frame2seq提供序列 -结构映射,以晶体结构为输入,将序列簇与其结构构型关联;源于这些计算模型并经界面结构验证的上位性分析,揭示关键残基-残基相互作用,为塑造蛋白质-蛋白质相互作用的进化机制提供见解。 合成与天然蛋白质-蛋白质界面的结构和上位性特征 图5 界面组成的结构解析与上位性分析 (A)Z结构域链间接触:对于每个结构,链A以表面模型显示,链B以卡通模型显示,接触残基的侧链以棍状模型显示;非接触库残基为蓝色或蓝灰色 发现由天然进化出蛋白质结合能力的表面形成的复合物,与由非结合表面形成的复合物相比,其上位性类型和塑造亲和力、特异性及正交性的结构适应性存在差异。

    11920编辑于 2026-03-03
  • 来自专栏机器之心

    4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源

    编辑 | ScienceAI 蛋白结构相比于序列往往被认为更加具有信息量,因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破,大量的预测结构被发布出来供人研究使用。 如何利用这些蛋白结构来训练强大且通用的表征模型是一个值得研究的方向。 实验结果表明SaProt各种蛋白质任务上都要好于之前的序列和结构模型。 这样对于蛋白质的每个位点,其氨基酸类型和对应的局部结构都能组合成新词表中的某个元素,从而让模型同时考虑到蛋白质的序列与结构信息。 蛋白质区分开来,而ESM-2的可视化结果却将两种蛋白质混杂在一起,这说明了SaProt对结构的变化有很强的感知能力。

    32910编辑于 2024-04-26
  • 来自专栏智药邦

    Nature|仅根据靶点结构设计蛋白质的结合蛋白

    我们成功地解析出了五个结合蛋白-靶点复合物的晶体结构,所有这五个结构都非常接近于相应的计算设计模型。 目前大多数用于蛋白质与靶点表面结合的计算设计方法都是利用来自天然复杂结构的信息。已有研究对具有不同环形几何结构的抗体结构进行计算对接,并产生了结合物,但设计的结合模式很少被高分辨率的结构解析所验证。 图4|设计的结合物具有高靶点特异性 高分辨率的结构验证 高分辨率的结构对于评估计算蛋白设计的准确性至关重要。 我们成功地获得了FGFR2和IL-7Rα的非结合小蛋白结合物的晶体结构,以及H3、TrkA、FGFR2、IL-7Rα和VirB8的迷你蛋白结合物与它们的靶点的共晶体结构(扩展数据表2)。 结论 我们成功地为14个靶点位点设计了纳摩尔级别的亲和力结合物,这表明结合蛋白可以仅用靶点蛋白结构信息进行从头设计,而不需要事先提供结合热点的信息或结合的复合物结构的片段。

    2.8K20编辑于 2022-04-13
  • 来自专栏科研猫

    IBS—绘制核酸、蛋白结构图的神器

    IBS简介 IBS是一款专业的核酸和蛋白质生物序列图绘制软件,为华中科技大学薛宇教授的团队CUCKOO制作,内置蛋白质序列和核酸序列的多种模板和推荐配色,也可以自己进行创作。 两者的区别是:下载版有35个蛋白样品图和27个核酸样品图,在线版只有20个蛋白样品图和20个核酸样品图。 01 查找序列结构 首先查找相关基因或者蛋白质的序列结构,查询网站一般用以下三个: Ensembl: http://grch37.ensembl.org/Homo_sapiens/Info/Index //www.uniprot.org/ 02 绘制图形 首先登录IBS网站: http://ibs.biocuckoo.org/ 在线绘制图形,有三种绘制方法:1、自定义画图;2、模板上修改;3、输入蛋白质 3、输入蛋白质ID。在网站首页点击FOR DATABASE,可以直接搜索蛋白质的ID进行绘图。 ? 03 观看视频学习 如果想了解更加详细的图画绘制步骤可以观看网站发布的教学视频学习。

    4.8K20发布于 2020-07-16
  • 来自专栏DrugOne

    Science | 蛋白结构预测: now easier, faster

    根特大学的结构生物学家 Savvas Savvides 曾六次尝试模拟一种有问题的蛋白质。 但是 AlphaFold2 只解决了单个蛋白质的结构,而 RoseTTAFold 也预测了复合物,例如锁定在其受体上的免疫分子白细胞介素 12 的结构。 巴塞尔大学的计算结构生物学家 Torsten Schwede 说,许多生物功能取决于蛋白质-蛋白质的相互作用。 “直接从序列信息处理蛋白质-蛋白质复合物的能力使其对生物医学研究中的许多问题极具吸引力。” ? Baker承认,总的来说AlphaFold2 的结构更准确。 但 Savvides 表示,Baker实验室的方法更好地捕捉了“蛋白结构的本质和特殊性”,例如识别从蛋白质侧面伸出的原子串——这是蛋白质之间相互作用的关键特征。

    56470发布于 2021-07-28
  • 来自专栏智药邦

    Nature|确定蛋白结构的短暂状态

    因此,结构生物学的一个挑战是扩大确定这些高能状态的方法。目前确定蛋白结构的技术,包括X射线晶体学和低温电子显微镜,都具有局限性。 解决方案 在核磁共振中,蛋白质中的每个原子都可以通过其原子核在磁场中的共振频率来检测,这称为化学位移。但仅仅测量化学位移并不足以准确计算蛋白结构。 这种方法以前被用来确定蛋白质的主要结构,但我们将其与 CPMG 弛豫色散(PCS-CPMG)结合起来,以确定蛋白质在其高能状态下的 PCS。 这项工作概述了一种确定蛋白质中这种瞬时结构的新策略。 --Hashim Al-Hashimi 美国北卡罗来纳州达勒姆的杜克大学医学院生物化学系 这篇论文的背后 大约20年前,我意识到最具生物活性的蛋白质构象是高能状态,而不是充满蛋白结构数据库的低能结构

    51810编辑于 2022-04-13
  • 来自专栏R语言数据分析指南

    ggplot2优雅绘制蛋白结构域与基因结构

    0.1,1.2), legend.justification = c(0,1.2), legend.text=element_text(color="black",size=8)) 绘制蛋白保守结构域 fill = guide_legend(direction = "horizontal"))+ guides(fill=guide_legend(nrow=1, byrow=TRUE)) 绘制基因结构

    2.7K20编辑于 2022-09-21
  • 来自专栏机器学习初学者精选文章

    【数据竞赛】天池蛋白结构预测大赛总结

    :Top5分享 比赛背景 蛋白质是生命活动中重要的组成,蛋白质的结构决定了蛋白质在生命活动中的功能,因此对蛋白结构进行分析具有重要的实际意义。 蛋白结构又可分为一级结构,二级结构,三级结构和四级结构。 ,每条蛋白质序列与二级结构序列长度相同,蛋白质序列中字母表示氨基酸类型,二级结构字母对应当前氨基酸构成的二级结构,二级结构中的空白也是一种松散结构的表示。 蛋白质可以看成是一条氨基酸序列,在空间中是一种相互交错螺旋的结构,像一条互相缠绕的绳子: 这种三维结构叫做蛋白质的三级结构,而如果不考虑结构的三维性,或者说把这整条序列拉直,用一个一维的序列表示,这便是得到了蛋白质的一级结构 用这样的序列表示蛋白质比起原始的三维结构确实方便不少,但却丢失了三维的结构信息,蛋白质的结构决定其功能,这里的结构不止是序列本身,更多的还依赖其三维结构

    92120发布于 2021-04-16
  • 来自专栏生信菜鸟团

    RNA 结构预测为什么比蛋白质难?

    AlphaFold 蛋白结构数据库现已收录约2亿个结构,2024年其开发者因此荣获诺贝尔化学奖的一半。 但这仅限于蛋白质。 RNA结构预测为何更难? 与蛋白质类似,RNA结构的解析也依赖昂贵且耗时的实验方法,而计算方法可以成为辅助工具。但RNA的结构预测难度更高。 结构预测:蛋白质遥遥领先 RNA结构预测工具的发展远落后于蛋白质。即便是AlphaFold的最新版本 AlphaFold3,在RNA结构预测方面表现也十分有限。 RNA结构的特殊挑战 与蛋白质相比,RNA分子具有更灵活的骨架,且结构更加动态,在完成功能时可能发生显著构象变化。 蛋白质数据库 PDB 包含近20万个蛋白结构,而RNA结构不到2000个。这限制了AI模型的训练空间。 麻省理工学院生物医学工程师 Jim Collins 表示:“我们已经尽力利用有限数据。

    34200编辑于 2025-03-28
  • 来自专栏生信修炼手册

    SMART:蛋白结构域数据库

    SMART是蛋白结构域的数据库,该数据库最新版本为v8,收录了1300多个蛋白结构域信息,覆盖了来自uniprot, ensembl等多个数据库的蛋白。 ,这些蛋白序列是存在冗余的,genomic模式下只包含了拥有完整蛋白质组的物种的信息。 输入uniprot或者ensembl 数据库中的蛋白ID进行检索,示例如下,根据uniprot数据库中的蛋白IDC1S_HUMAN进行检索 http://smart.embl-heidelberg.de domian 结构图 ? 从图中,可以看出,该蛋白质包括以下5种domain CUB EGF_CA CCP Tryp_SPc 还提供了每个结构域的位置信息 ? 2. 蛋白质相互作用 提供了来自STRING数据库的蛋白相互作用信息,示意如下 ? 3.

    4.7K20发布于 2020-05-08
  • 来自专栏新智元

    地球超2亿蛋白结构全预测,AlphaFold引爆「蛋白质全宇宙」!

    AlphaFold能够预测2亿多个蛋白结构,实现数量级的重大飞跃。 最重要的是,全部免费开放! 在未来,预测蛋白结构就如同使用「谷歌搜索引擎」一样简单。 当时,98.5%的人类蛋白结构全被AlphaFold2预测出来了。 而现在,DeepMind正式宣布该数据库已经从近100万扩大到2.14亿个结构,预测蛋白结构数量也提升了200多倍! AlphaFold在国际蛋白结构预测竞赛(CASP)上首次亮相,力压其他97个参赛者。 当时,AlphaFold预测出了43种蛋白质中25种蛋白质的最精确结构。 其预测了98.5%的人类蛋白结构,以及20个其他被大量研究的生物体的完整蛋白质组,其中包括小鼠、酵母菌和大肠杆菌,累计共有36.5万个结构。 他说:「从近100万个蛋白结构扩展到超过2亿个蛋白结构,几乎涵盖了所有基因组测序的生物体,这是一个巨大的里程碑!」

    67420编辑于 2022-08-26
领券