虽然最近的蛋白质设计机器学习方法取得了长足进步,但这一过程仍然十分费力,需要大量的实验测试。 了解蛋白质相互结合的复杂方式 能与目标蛋白质紧密结合的结合物很难设计。传统方法耗时长,需要多轮大量的实验室工作。结合物设计完成后,还要经过多轮实验来优化结合亲和力,使其结合得足够紧密,以便发挥作用。 对于另一个靶点TrkA,设计出来的结合物甚至强于之前针对该靶点设计的、经过多轮实验优化的最佳结合物。 图3 显示了与其他设计方法相比,AlphaProteo对七种目标蛋白中每一种的体外实验成功率。 更高的成功率意味着需要测试的设计更少,才能找到成功的结合物。 图4 条形图显示了AlphaProteo在未进行实验优化的情况下,与其他设计方法相比,对七种目标蛋白的最佳亲和力。 以负责任的态度发展蛋白质设计 蛋白质设计是一项快速发展的技术,它蕴含着巨大的科学潜力,能够助力我们深入了解致病机制、加速病毒诊断测试的开发、推动更可持续的生产工艺,并探索环境污染物清除的新途径。
随着全球变暖伴随更多的干旱和热浪,一些主要作物的收成正在减少。但更不易察觉的是这些植物内部发生的变化,高温可以分解维持其生命的分子机器。
---- 新智元报道 编辑:Joey 如願 【新智元导读】蛋白质设计最近风头正盛,这不又来了新作品,华盛顿大学的研究人员开发了两种深度学习算法可预设计特定功能的蛋白质。 ,金属蛋白和酶,以及具有围绕已知结合基序扩展的设计界面的靶结合蛋白。 潜在诺奖候选人、蛋白质设计师 提到蛋白质设计,不能不提到大名鼎鼎的蛋白质设计师——David Baker。 他是华盛顿大学生物化学教授和霍华德休斯医学研究所的研究员,IPD 所长和首席研究员。 在其他的几个测试中,该团队还为酶、蛋白质结合蛋白和抓住金属离子的蛋白质设计了功能位点。 这种方法为揭开天然蛋白质的神秘面纱打开了大门,同时也可能为合成生物学设计新的蛋白质。 参考资料: https://singularityhub.com/2022/07/26/protein-designing-ai-opens-door-to-medicines-humans-couldnt-dream-up
BoltzGen更进一步,能生成可直接进入药物发现流程的新型蛋白质结合物。三项关键创新使之成为可能:首先,BoltzGen能够执行多种任务,在保持一流性能的同时,统一了蛋白质设计和结构预测。 其次,该模型内置的约束条件是根据实验室合作者的反馈设计的,以确保其生成的蛋白质是功能性的,且不违背物理或化学定律。 目前工业界或学术界使用的大多数模型只能进行结构预测或蛋白质设计,且仅限于生成能成功结合“简单”靶点的特定类型蛋白质。 施特克指出,试图解决结合物设计的模型存在“模式特定”的问题。 另一位资深共同作者则指出:“像BoltzGen这样完全开源的模型,使更广泛的社区能够共同努力,加速药物设计能力。”展望未来,施特克相信生物分子设计的未来将被人工智能模型颠覆。
深度学习在蛋白质结构预测和蛋白质设计方面的应用日益增多,设计出的蛋白质已进入临床试验阶段,甚至获得了美国FDA的批准。 到目前为止,现有的基于MSA的工具在蛋白质设计方面还算有效,因为大多数设计的蛋白质都是高度刚性的。但随着我们开始设计更加灵活和动态的蛋白质,我预计目前基于MSA的方法将开始失效。 架构也是创新的;在蛋白质结构预测和蛋白质设计方面,已经有很多方法得到了发展。你需要将三者结合起来。 4、如何将结构预测与蛋白质设计相结合?如何从结构到功能? 它本质上是同一个网络,只是针对蛋白质设计而不是结构预测进行了微调。我想说的是,蛋白质设计--至少是我们一直在做的蛋白质设计工作--与结构预测的进步息息相关。 David Baker:我认为,在设计可作为药物的蛋白质方面,我们已经取得了进展。我们正在开展大量工作,利用蛋白质设计深度学习方法来设计小分子药物。我认为,在设计蛋白质疗法方面,我们已经做到了。
本次工作台的上线旨在打造一款国产AI蛋白质设计的「EDA软件」,围绕通用蛋白质预测和设计工作,为生物科技产业转化和落地服务。 xCREATOR通过集成世界前沿多样化AI算法和强大的计算资源,为大家提供更高效、更便捷、更易用的蛋白质结构预测与设计服务。 系统级应用 降低科研人员技术门槛 AI时代下的蛋白质设计计算和优化是非常复杂的流程,常常涉及几种甚至几十种算法应用,这背后不但需要大量算力,更需要研究人员在人工智能、计算生物学、计算化学、结构生物学等多个学科领域的技术与经验积累 AI for Science 加速释放研究价值 蛋白质世界的空间巨大、功能丰富,100氨基酸的蛋白质可能序列是 20^100 ~ 1.3×10^130,而目前人类仅探索了其中源于自然进化的极小一部分 “人类今天已经有了足够的AI工具去探索微观世界,我们希望通过打造算法、算力、数据融合的大型装置,让更多的人加入进来研究更具有挑战的科学问题,帮助人类看清更大的蛋白质世界。”
2024年11月4日,Nature发表文章Five protein-design questions that still challenge AI,讨论了蛋白质的AI设计仍然面临的五个问题。 Baker指出,这些生成式AI工具能够像手一样精确地为特定目标(如癌症蛋白)设计出结合物。 例如,在2023年,他的团队就利用RFdiffusion技术成功制造出了一种传感器蛋白,该蛋白在附着于特定肽类激素时会发光,这一成果展示了生成式AI在蛋白质设计上的巨大潜力。 对于与药物和其他小分子结合的蛋白质,由于可用训练数据相对较少,AI设计的结合蛋白可靠性往往较低。此外,许多制药公司的小分子结构及其与蛋白质的相互作用数据都是严格保密的,这进一步限制了AI的学习范围。 为解决此问题,研究人员正设计大型蛋白质库,通过变异揭示蛋白质动态变化。同时,设计能在两种构象间切换的蛋白质,既助训练AI模型,又可为构建复杂分子机器提供构件。
该平台由加州理工学院医学博士David Van Valen教授及其Aizen Therapeutics的研究团队共同开发,是Mirror Peptides(镜像肽)领域内的顶尖计算蛋白质设计模型。 镜像肽完全由D-氨基酸构成,是天然蛋白质和肽(由L-氨基酸组成)的镜像对应物。这种新颖的结构使镜像肽不仅能以强大的亲和力和特异性作用于靶点,还能增强稳定性和降低免疫原性,从而提高治疗效果。 由于面临艰巨的挑战,完全由D- 氨基酸设计并具有可编程治疗特性的镜像肽一直是业界孜孜以求的目标。DaX(D-氨基酸探索者)平台旨在克服这一障碍。” Aizen科学创始人、医学博士David Van Valen说:“通过将先进的生成式人工智能与结构生物学数据的广度相整合,DaX已经开启了全D-氨基酸疗法的全新计算设计。 Madrona合伙人Chris Picardo说:“Madrona在蛋白质设计的最前沿进行投资,与全国各地的研究人员合作。
且听我慢慢道来: ■ 抗体基础知识篇,“知己知彼百战百胜” 抗体 (Antibody),又名免疫球蛋白 (Immunoglobulin,Ig),是一种由 B 细胞产生的大型 Y 形糖蛋白。 ■ 离心法,适合通过 IP 捕获蛋白或研究蛋白-蛋白间相互作用。精细化操作,稳! 将 Anti-Flag 亲和凝胶吸入离心管,使用离心法操作。 第三关 目的蛋白结合、洗脱 Input 明明有目的蛋白,目的蛋白明明已结合,但洗脱液中却没有目的条带。 巧设对照,巧留样,蛋白洗脱,我在行。 ■ 巧妇难为无米之炊,想让我“无中生有”?No Way! ■ 洗脱后杂带多、纯度低 面对这个棘手的问题,我们首先需要分析杂蛋白的来源:是来自于目的蛋白的降解产物?与填料的吸附?还是与目的蛋白的互作? 1)蛋白部分降解:使用恰当的蛋白酶抑制剂;如对于低 pH 环境很敏感,需在洗脱前的接收管中提前加入中和液。
研究人员提出了一种通用方法,设计可结合无结构蛋白区域的结合蛋白,其侧链能够嵌入互补的结合口袋中。研究人员成功设计了39种结合多种多样无结构靶标的蛋白,其中34种设计的解离常数在百皮摩尔至百纳摩尔之间。 所有设计在细胞中均表现出良好功能,并在全交叉结合实验中展现出对目标的高度特异性。这项研究为解决无结构蛋白和肽的识别难题迈出了关键一步。 应用示例 蛋白组学富集:设计子可用于富集低丰度蛋白(如WASH复合体、PER2等),对研究信号通路具有价值。 疾病靶点识别:用于识别突变型肽段(如CTN4),在临床质谱检测中具有潜力。 细胞定位与特异性验证:在细胞中观察到设计子与目标蛋白具有高度特异性的共定位,验证其在生物体系中的功能性与正交性。 该方法融合物理设计的严格性与深度学习的灵活性,提供了一种新范式,拓宽了蛋白质设计的边界,为识别与调控无结构蛋白开辟了新的可能。 整理 | DrugOne团队 参考资料 Kejia Wu et al.
2023年11月28日,利用生成式人工智能帮助科学家设计和制造蛋白质的生物技术初创公司 Cradle 宣布完成 2400 万美元A轮融资。 自2022年面市以来,Cradle的生物人工智能技术需求旺盛,并证明了其平台在大幅降低蛋白质产品设计的研发时间和成本方面的有效性。 目前,该公司正在开展 12 个以上的研发项目,重点关注各种蛋白质疗法的工程设计,包括酶、疫苗、肽和抗体,涵盖了所需蛋白质的广泛特性,如稳定性、表达、活性、结合亲和力和特异性。 通过使用生成式人工智能和机器学习来帮助生物学家更快、更高效地设计和优化蛋白质,我们可以帮助研发团队更快地创新、更少地花费,并最终更成功地开发出新产品。 看到科学家们如何利用 Cradle 设计新的蛋白质并推动编程生物学这一新兴领域的发展,我们感到非常兴奋。”
2024年3月21日,人工智能蛋白质设计公司Profluent宣布完成3500万美元追加融资,融资总额达到4400万美元。 正如ChatGPT可以写出引人入胜的文章和电子邮件一样,Profluent开发的人工智能可以设计出全新的功能性蛋白质。 关于Profluent Profluent是一家以人工智能为先导的蛋白质设计公司,总部位于加利福尼亚州伯克利。 Profluent成立于2022年,致力于开发深度生成模型,以设计和验证新型功能蛋白质,从而彻底改变生物医学。 20240321410207/en/Profluent-Secures-35M-in-Additional-Funding-and-Key-Industry-Experts-to-Scale-Foundational-AI-Models-for-Biomedicine-and-Tackle-First-Vertical-in-Gene-Editing
2024年10月16日,Science发表文章AI designer proteins could transform medicine and materials,评述了今年诺贝尔化学奖(利用人工智能设计出前所未有的蛋白质 瑞士洛桑联邦理工学院的蛋白质设计师Casper Goverde指出:“我们现在几乎可以设计出任何我们想要的蛋白质形状。” 自Baker的早期实验以来,蛋白质设计软件已经融入了越来越强大的人工智能技术。 在疫苗领域,人工智能蛋白质设计已经初见成效。2020年,COVID-19大流行刚刚开始不久,华盛顿大学的研究人员就设计出了能附着于SARS-CoV-2尖峰蛋白特定部分的蛋白质,阻止病毒穿透人体细胞。 此外,设计人员还在开发用于寻找癌细胞表面特殊分子并与之结合的蛋白质,以便化疗药物能够将其摧毁。化疗药物由设计好的类似病毒的蛋白质载体递送。 参考资料: https://www.science.org/content/article/ai-designer-proteins-could-transform-medicine-and-materials
David Baker是蛋白质AI设计领域的巨擘。 参见AI蛋白质设计的进化|David Baker近两年半发表19篇CNS主刊文章 2024年1月25日,David Baker在Science发表评论文章Protein design meets biosecurity ,探讨了蛋白质设计的生物安全性问题。 随着人工智能方法的应用,蛋白质计算设计的能力和准确性迅速提高。这有望改变生物技术,推动可持续发展和医学的进步。DNA合成在实现蛋白质设计方面发挥着关键作用。 过于严格的人工智能法规可能会阻碍计算蛋白质设计的进展。好消息是,用于蛋白质设计的人工智能工具高度专业化,因此降低风险应该更加简单明了。
前言: 随着alphafold2突破性预测蛋白结构的成功,学术界也开始尝试探索如何使用它进行高精度的蛋白序列设计。本篇快速地进行一下解读。 2. 2.2 迭代end-2-end设计 设计方法的核心是通过MCMC算法对序列空间进行采样,接着使用AlphaFold预测结构,直到生成与目标结构的backbone尽可能地相似。 设计结果 作者使用了人工设计的Top7作为测试集。 在第一阶段进行序列设计时,af2预测的TM-score仅有0.746,经过上述的方法进行迭代设计之后,新设计的序列与Top7的相似性仅为27%。 均证明,设计的序列与目标结构可能是同一种Fold。 讨论 作者通过使用缩水版的alphafold2进行fix-backbone设计,本质上即使用基于pLDDTscore版本的mcmc序列采样,最后通过结构验证所设计的序列可靠性。
1 背景 计算蛋白质设计的一个中心目标是自动创造具有明确结构和功能特性的蛋白质分子。 表3 4.2基准测试蛋白质重新设计 为了评估模型在生成逼真蛋白质序列方面的性能,作者进行了2个实验,并与Rosetta,一种最先进的计算蛋白质设计框架进行了比较。 在表4(b)中,还比较了来自Rosetta community中40种不同蛋白质的基准。 表4 4.3实验蛋白设计的无监督异常检测 设计序列的合成和检测是评价蛋白质设计方法的黄金标准。 作为一种无监督异常检测,可以通过比较最近高通量设计实验中赋予功能性和非功能性突变蛋白的可能性,来衡量模型对蛋白质功能的了解程度。 作者比较了最近的一个高通量设计和诱变实验,在这个实验中,几个新设计的微蛋白被系统诱变到所有可能的点突变。作者发现该模型的对数似然非平凡地反映出对突变蛋白的偏好 (表5)。
近日,蛋白质设计大神、华盛顿大学生物化学教授 David Baker 团队及其合作者,将强化学习带入蛋白质设计,开发了一款功能强大的新型蛋白质设计软件。 实验结果显示,由这种新方法合成的蛋白质能更有效地在小鼠体内产生有用抗体,这一突破可能很快就会帮助科学家设计出更有效的疫苗。 研究团队表示,这项研究是利用人工智能进行蛋白质科学研究的一个里程碑。更广泛地说,这种方法或将蛋白质设计带入一个新时代。 Isaac Lutz 作为这项研究的一部分,研究团队在实验室里制造了数百种由人工智能设计的蛋白质。通过使用电子显微镜和其他仪器,他们证实了许多由计算机创建的蛋白质形状确实在实验室里实现了。 Shunzhi Wang 一直以来,David Baker 团队也专注于设计由许多蛋白质分子组成的新型纳米级结构。这需要设计蛋白质成分本身和允许纳米结构自组装的化学界面。
该研究为蛋白质构象生成提供了高效框架,结合语言模型和扩散模型优势,推动动态蛋白质设计。 5. 结果显示,在λ=1.0时,生成蛋白的覆盖度达0.78,接近真实蛋白的0.89,且在设计性-多样性权衡上超越Multiflow。该研究为蛋白质结构的可控生成提供了新范式,助力模块化蛋白设计和功能探索。 id=KHkBpvmYVI 简介: 本文针对蛋白质基序支架设计中的生成与重建权衡问题,提出几何逆设计框架EVA,利用耦合流模型加速基序支架生成。 该研究为动态蛋白质建模提供新框架,推动基于结构的药物设计发展。 11. 用户可通过手绘、拖拽等操作生成新型拓扑结构,如铰链蛋白和纳米材料支架,展示了其在复杂结构设计中的灵活性。该研究为蛋白质设计提供了直观的拓扑控制工具,推动生成模型在功能蛋白和分子组装中的应用。 15.
2024年7月8日,Nature发表新闻文章Ex-Meta scientists debut gigantic AI protein design model,介绍了前Meta科学家推出的巨型蛋白质AI 此后,其他团队也利用ESM-1设计了抗体,提高了对病原体(包括SARS-CoV-2)的活性,并重新设计了“抗CRISPR”蛋白,提高了基因编辑工具的效率。 Rives的研究小组要求ESM3创造出一些类似GFP的蛋白质,这些蛋白质包含GFP发色团中的一组关键氨基酸。 研究人员合成了88种最有前景的设计,并测量了它们的荧光能力。 当研究人员制作出大约100个这样的蛋白时,其中几种的亮度与天然GFP相当,尽管它们仍然比实验室工程化变体暗得多。 ESM3设计的最亮的蛋白质之一被称为esmGFP,其结构与天然荧光蛋白相似。 Rives渴望将ESM3应用于其他设计。Pacesa曾是使用不同蛋白质语言模型制造新CRISPR蛋白质团队的一员,他说,看看ESM3在这方面的表现会很有趣。
计算机蛋白质设计的能力和精确度随着人工智能(AI)方法的整合迅速提高。这将转变生物技术领域,使其在可持续性和医学方面取得进展。DNA合成在实现设计蛋白质方面发挥着关键作用。 大自然的蛋白质在漫长的进化过程中巧妙地应对了各种挑战,但今天的问题,如全球性病原体、神经退行性疾病和生态系统退化,需要新的解决方案。AI加速的蛋白质设计可以帮助解决许多这些问题。 但正如去年在英国举行的全球AI安全峰会所反映的那样,规范AI的道路可能会漫长且复杂。过于严格的AI法规可能会阻碍计算蛋白质设计的进展。 好消息是,用于蛋白质设计的AI工具高度专业化,因此风险缓解手段应该相对直截了当。 在2023年AI安全峰会之前,华盛顿西雅图的一次会议召集了来自学术界、工业界、慈善界和政府机构的国际代表,讨论AI支持的蛋白质设计,特别是在大流行准备和药物开发方面。