目前我们常用的多肽合成方法主要分为两大类:液相多肽合成和固相多肽合成,下面为大家分别讲解一下这两种方法。1. 液相多肽合成(Liquid-phase Peptide Synthesis)液相多肽合成是一种经典的多肽合成方法,虽然现在大多数在实验室中已经被固相多肽合成所取代,但在工业上大规模生产多肽时仍具有可用性 固相多肽合成(Solid-phase Peptide Synthesis, SPPS)固相多肽合成由罗伯特·布鲁斯·梅里菲尔德(Robert Bruce Merrifield)首创,现在已成为实验室中制造多肽和蛋白质的常用有机合成方法 BOC策略:使用叔丁氧羰基(Boc)作为氨基酸N端的保护基,但在多肽合成过程中需要反复使用TFA脱Boc,而且在最后将多肽从树脂上切割下来需要使用HF,由于HF必须使用专门的仪器进行操作,且多肽切割过程中容易产生副反应 固相多肽合成的流程:通常包括缩合、冲洗、去除保护、再冲洗等步骤,这些步骤反复循环直到合成完成。最后,多肽从树脂上洗脱下来,经过纯化和脱保护,得到最终的多肽产品。
主要多肽类别及其功能。凭借其多样的生理功能,多肽被广泛应用于分子生物学、疾病研究、药物和疫苗开发等领域。多肽的主要应用有哪些? ®),其载体肽 Tyr3-octreotate 可将核素 177Lu 递送至表达生长抑素受体的肿瘤部位,实现靶向治疗。 其中,多肽固相合成法 (solid phase peptide synthesis, SPPS) 自 1963 年被 Bruce Merrifield (1984 年获诺贝尔化学奖) 发明以来3,凭借简单 多肽的固相合成将氨基酸的 C 端 (羧基端) 通过共价键固定在不溶的固体树脂颗粒上,逐步添加其他氨基酸,直至组装出所需的序列,将多肽从树脂上切割下来并进行纯化3。 典型的多肽固相合成一般包含以下步骤 (图 2)4:1)氨基酸耦合:选择合适的树脂,将被保护基团保护的氨基酸与树脂结合;2)脱保护:去除氨基酸的保护基团,暴露活性氨基;3)活化与缩合:活化下一个氨基酸的羧基
导语 AI多肽设计第一轮比赛结果已公布!在已完成的实验测试中,活性最强的参赛序列EC50达 2 nM,已超越天然多肽 NKA 的水平,充分展示了AI驱动多肽药物设计的巨大潜力。 现正式启动第二轮多肽序列征集,我们诚邀全球科研人员与青年学者继续参与,共同探索AI赋能下的多肽药物设计新前沿。 第一轮结果
在多肽行业,我们常用的多肽合成的工艺流程,特别是固相多肽合成的流程,具体可以细分为多个步骤。 使用高效液相色谱(HPLC)等方法对粗肽进行纯化,以去除杂质并分离出目标多肽。浓缩、过滤与冻干:将纯化后的多肽溶液旋蒸除去有机溶剂,得到浓缩的多肽溶液。对浓缩后的多肽溶液进行无菌过滤。 将过滤后的多肽溶液置于冻干机中,设定适当的升温程序进行冻干处理。冻干结束后取出多肽产品,进行包装、入库等后续操作。 举例:序列:RGDAG 700mg 95%1.根据多肽序列选择Fmoc-Gly-Wang Resin王树脂2.根据多肽要求确定树脂用量5g3.秤取5g树脂放到反应柱中,先用约50ml二氯甲烷浸泡1分钟 7.根据多肽序列合成完多肽后,用二氯甲烷洗树脂3次,乙醚洗树脂3次,抽干,干燥。9.送切割。10.最后用TFA切割液100ml与缩合上氨基酸的树脂做切割反应,滤液中加乙醚使得多肽析出得到粗品。
PART 01 多肽药物市场规模分析根据Nature的数据,截至2019年,多肽药物约占全球医药市场的5%(图1)。 多肽药物以慢病治疗为主,目前国际上的多肽药物主要分布在7大疾病治疗领域,包括罕见病、肿瘤、糖尿病(内分泌与代谢类)、胃肠道、骨科、免疫、心血管疾病等,其中罕见病、肿瘤和糖尿病是拉动多肽药物市场的“三驾马车 据弗若斯特沙利文数据,预计2030年全球多肽药物市场规模将达到2,108亿美元,其中中国市场规模占全球比重维持在15%左右(图3)。 图1 全球药物市场 (2019)图2 多肽药物治疗适应症图3 全球及中国多肽药物市场规模PART 02 FDA近几年批准上市的治疗性多肽ART 03 多肽药物相关交易近几年,多肽领域(包含PDC)的大额交易或收购主要发生在 参考文献:[1]《2023年中国多肽药物行业概览》沙利文&头豹[2]https://doi.org/10.1038/s41573-020-00135-8[3]https://doi.org/10.1007
Algorithms) • 2.4 基于结构的设计范式 • 2.5 基于序列的设计范式 3. 然而其固有缺陷日益凸显: 问题维度 具体表现 批次稳定性 不同批次抗体性能差异显著,跨实验室重复困难 序列透明度 动物免疫来源的多克隆/单克隆抗体序列不公开,结合机制模糊 生产周期 从免疫到纯化通常需要 3– 7 天(vs 抗体 3–6 个月) • 可进入活细胞(结合细胞穿透肽技术) • 高通量合成与筛选成本低 1.3 传统多肽发现的瓶颈 传统的多肽发现流程(噬菌体展示、组合文库筛选、天然结合基序的迭代突变) 多目标优化困难:难以同时兼顾亲和力、特异性、溶解性、稳定性 3. 靶标受限:难以针对无序区域或缺乏结构信息的靶标 4. 代表性实现 蛋白降解系统: • uAbs(泛素抗体):引导多肽融合至 E3 泛素连接酶催化结构域(CHIP 等),指导泛素化和降解;SaLT&PepPr、PepMLM、PepPrCLIP 设计的多肽均已用于
首先,是多肽药物的稳定性问题,多肽药物因为其众多肽键的存在而容易被体内的肽酶水解。David Baker选择了环状多肽这样一类结构来解决它的稳定性问题。 环孢菌素以及索马鲁肽等口服多肽药物的存在,让科学家们发现,多肽的口服是可以实现的。但是,人们对多肽药物实现口服这个问题一直研究得不够深入。这是阻碍多肽药物市场进一步拓展开来的一个极为极为重要的因素。 此处6-8个残基透膜肽中,N-甲基化氨基酸的数量在0到3之间。 在这15个结构中,有3个9-mers、5个10-mers和4个11-mers大环肽与它们的设计模型密切匹配(骨架RMSD为1.2Å或更低)(图3)。 图4:构象转换大环肽的设计和结构表征 3.讨论 作者通过使用多种局部结构和内部氢键的极性基团的构象屏蔽来实现这种高渗透性。
因此,多肽与MHC结合是抗原呈递过程中的关键。识别能与MHC分子结合的多肽是开发癌症疫苗的重要步骤之一。 在三种不同长度(11,10,和9氨基酸)的多肽数据集上,相比于NetMHCpan 3.0,ACME在PCC指标上分别提升了11%、5.3%和3.4%(如图3所示)。 此外,作者将ACME模型与较新的ConvMHC模型在多肽与MHC结合预测性能方面进行了对比。值得注意的是,ConvMHC只能应用于长度为9的多肽上。 在这个长度的多肽上,ACME的准确率比ConvMHC 高1.2%。而除了长度为9的多肽,ACME还可以对不同长度的多肽进行精确预测。 图3. 预测性能比较 3.2 ACME的泛化能力 作者还进行了两个额外的测试来评估ACME的泛化能力。
iDVIP: identification and characterization of viral integrase inhibitory peptides
20世纪80年代重组技术的出现使生产更大的多肽成为可能。随后,通过结合脂类、较大的蛋白质和聚乙二醇来增加多肽分子量的策略有助于克服肾脏清除和增加血浆循环时间的问题。 像噬菌体展示这样的显示技术现在允许从巨大的文库中以目标为导向发现具有更多药物性质的多肽。Flexizyme技术允许将非蛋白原性氨基酸纳入展示库。 目前获批的多肽类药物中,大多数是激动剂,最常见的靶向适应症与内分泌学、代谢和肿瘤学有关。 ? 图2. 多肽药物市场 肽药物发现策略 整合的毒液组学和显示技术是发现治疗性先导物的两项关键技术。 图5.肽药物的药物化学策略 肽药物开发展望 在过去的60年里,多肽疗法得到了稳步的认可,我们预计这一趋势将会加速,因为生物制剂已经消除了药物需要口服才能成功的传统假设。 多肽领域在许多方面已经成熟,包括能够大规模、可靠、快速地生产结构复杂的多达100个氨基酸的多肽的平台,使高效、低成本的SAR和先导物优化研究成为可能。
之后结合MS识别的多肽(hits)与未识别到的多肽(decoys)生成AP模型的训练集以结合MHCI类等位基因信息。 它的神经网络结构包含了多肽N端和C端裂解或加工信号(图3A)。 图3. AP预测因子结构与实验对比 作者在MULTIALLELIC基准上评估了MHC FLURRY 2.0 AP的准确性(图3B)。虽然它们没有将MHC等位基因作为输入,但平均AUC仍取得较大值。 另外作者通过AP预测对多等位基因基准中的所有长度为9的多肽进行排序,计算出前1%最高预测值的位置权重矩阵,并绘制了序列标识(图3C)。 该分析显示,半胱氨酸在整个多肽中的hits缺失,这是MS的已知偏差。
PART 01 多肽药物定义多肽是由多个氨基酸通过肽键连接而形成的一类化合物,通常由2-50个氨基酸分子组成,其连接方式与蛋白质相同,对应分子量在10,000 dalt以内,其广泛参与和调节机体内各系统 表1 多肽药物与传统小分子化药和蛋白质药物的比较PART 03 多肽药物的合成方法及特点多肽药物合成一般有生物合成法和化学合成法。其中化学合成法中的固相合成法是目前多肽药物的主流方法。 常用的肽结构修饰策略包括:1 主链修饰,如酯肽、氮肽、内硫肽、反转-D肽、氟代烯烃结构,以及用三唑或氧杂环取代酰胺键;2 末端修饰,如N端烷基化、N端杂环缀合、C端酯化或酰胺化;3 大环化修饰,通过头尾环化 图4 用于克服肽类使用限制并提升其类药物特性的修饰策略PART 05 FDA近几年批准上市的治疗性多肽参考文献:[1]《2023年中国多肽药物行业概览》沙利文&头豹[2]https://doi.org/ 10.1038/s41573-020-00135-8[3]https://doi.org/10.1007/s00726-025-03454-5[4]皓元医药公司公告
3)建模Poly-A-receptor相互作用 通过将肽残基突变为丙氨酸(在查询序列中),对基序和非基序数据集进行对接,保持每个结构的原始肽长度,然后用AF2建模。 3 实验结果 1)将基于神经网络的结构预测应用于肽对接 作者将对接模拟为单体折叠——将多肽序列通过聚甘氨酸linker添加到受体单体序列的C端。 图2 3)肽序列在成功对接中起着至关重要的作用 为了更好地理解AF2对肽序列的依赖性,作者测试了一个极端情况,其中整个肽序列被聚丙氨酸取代。 结果发现,模型性能显着降低,特别是当去除保守基序时(图 3)。总的来说,在没有任何关于肽序列的信息的情况下,AF2无法成功地模拟肽-蛋白质复合物结构。 图3 4)AF2建模配体结合诱导的构象变化 蛋白质对接中最具挑战性的任务之一是对结合时发生的构象变化进行建模。
长期以来的多肽识别方法,如搜索引擎和实验质谱库,正在被深度学习模型所取代,这些模型可以根据多肽的氨基酸序列来预测其碎片质谱。 该领域目前的挑战包括预测具有翻译后修饰的多肽和交联的多肽对的质谱。 修饰和交联的多肽 PTMs是对蛋白质的共价修饰,可以发生在氨基酸侧链或末端。它们的存在改变了离子序列成员的质量,也可以对峰强度产生深远的影响。此外,由于特定于修改的中性损失,它们可能会产生额外的碎片。 深度学习在多肽识别问题上的另一个有前途的应用是DeepMatch,它规避了光谱的预测,直接预测PSM分数。
多肽不仅与多个生理活动相关联,还可以自组装成纳米粒子,参与到生物检测、药物递送、组织工程中。 然而,多肽的序列组成过于多样,仅 10 个氨基酸就可以组成超过百亿种多肽。 在仅有 8,000 个训练数据时,模型的决定系数 R2 就超过了 0.85,较 SVM 提升了 11.8%,较 RF 提升了 54.5% 图 3:TRN 模型和其他非深度学习模型的性能对比 随着训练数据的增加 图 7:不同 AP 区间中,20 种氨基酸在不同位置的分布比例 F、Y、W 在 3-5 号位,尤其是 3 号位时,对多肽自组装贡献最强。 可能是因为在 3 号位上,氨基酸的自由度较高,更易通过 π-π 作用驱动多肽自组装。 由于这些氨基酸的侧链和水之间相互排除,疏水性强,对多肽自组装贡献较强。这组氨基酸常分布在多肽的两端,尤其是自组装多肽的 N 端。
二、抗原合成技术抗原合成分为多肽合成和重组蛋白表达两大技术路径,分别适用于不同类型的抗原需求。1. 多肽合成多肽合成采用固相肽合成(SPPS)技术,是定制抗原合成中快速、精准的手段。 多肽合成与修饰根据设计序列进行多肽合成,支持各种化学修饰和载体偶联。重组蛋白表达与纯化支持不同表达系统,结合优化表达条件,实现高效产物表达及纯化。 A: 抗原合成定制服务涵盖多肽合成、重组蛋白表达、纯化及质量检测。多肽合成适合短肽抗原,速度快纯度高;重组蛋白表达适用于复杂蛋白抗原。 Q3: 多肽抗原合成与重组抗原表达有何区别?如何选择? A: 多肽抗原合成基于固相肽合成技术,适合短肽和表位设计,合成周期短,纯度高;重组抗原表达通过哺乳动物细胞或大肠杆菌表达系统,适合结构复杂、需正确折叠和修饰的蛋白。
2024年12月20日,人工智能多肽发现领域的开拓者Nuritas成功完成了超额认购的4200万美元C轮融资。 Nuritas以多年的深层科学研究为基础,正在改变配料开发的模式,将从各种食用植物中发现的、以前无法获得的促进健康的多肽配料推向市场。 对科学的深刻承诺和以客户为中心的解决方案推动市场影响 经过近十年的突破性研究,Nuritas建立了世界上最大的多肽知识库。 其尖端的人工智能平台Magnifier™识别多肽的速度是传统方法的10-50倍,临床成功率超过80%,远远超过行业标准。 关于Nuritas 通过其开创性的人工智能专利Magnifier™平台,Nuritas识别出具有独特性能的多肽,使其客户能够创造出满足当今消费者需求的差异化产品。
不增加对正常组织和器官毒性的情况下提高治疗效果是抗肿瘤治疗的一大难题。众所周知,肿瘤细胞过度表达碱性磷酸酶。碱性磷酸酶是临床上测试最多的肿瘤生物标志物。在活细胞碱性磷酸酶活性谱的研究中发现碱性磷酸酶存在于多种肿瘤细胞(例如HeLa和Saos2)的表面,而不存在于骨髓基质细胞(例如HS-5)的表面。在此,布兰迪斯大学徐兵教授团队将细胞表面的碱性磷酸酶作为上下游相关信号提高蛋白酶抑制剂硼替佐米的疗效,从而有效抑制肿瘤细胞,并减少硼替佐米的毒副作用(如对骨髓基质细胞的毒性)。
目前,在自然界发现了7000多种多肽,这些多肽在各种生理过程中发挥着重要作用。 在多肽药物发展的过程中需要重点关注多肽的这三个属性:毒性、免疫原性以及稳定性。目前在这个三个属性中,多肽的毒性受到的关注最少,其也是限制多肽药物发展的主要因素之一。 然而,在湿实验室中利用传统实验的方法验证多肽的毒性通常费时、费力且成本高,并且随着多肽数据的增长,传统的实验方法已经不能满足我们的需求,因此,研究人员非常有必要建立基于机器学习的技术来检验多肽的毒性,这种技术可以有效地减少候选多肽药物的搜索 表示第t次迭代节点u和v之间的边的嵌入,HASH函数将公式(2)或者(3)中的元组映射为自然数,即点或边的嵌入。 2.CNN_BiLSTM:首先利用CNN从多肽的位置特异性得分矩阵中提取多肽序列的局部信息,接着,利用BiLSTM提取多肽序列中的远距离依赖关系,从而得到多肽的进化特征。
使用领域先验知识在小范围内生成候选多肽搜索库(例如从特定的基因序列中生成或是针对已知抗菌序列片段进行截取或者扩增),将训练好的模型在上面进行验证,选出其中最好的进行实际的湿实验。 3. 在长度为 6-9 的多肽全库上进行了测试,湿实验结果表明筛选出的抗菌肽的有效率达到了 98.2%,证明了整套模型的泛化性能。 3. 图 3.e 表明,LSTM 要显著优于剩下的若干模型,因此我们最终选择 LSTM 模型。 3. 对多肽或者蛋白质序列的发掘,使用多种层级的序列建模,并融合输入到模型中可能是一条缓解数据噪音,发掘序列潜在规律的一种有效方案。 通讯作者介绍 张鹏,浙江大学高分子系百人计划研究员。 研究方向:1.高分子生物材料;2.蛋白质药物修饰;3.免疫工程;4.生物材料表界面。 赵俊博,浙江大学计算机学院百人计划研究员。研究方向:1.深度学习;2. AI+X;3.预训练大模型;4.