科学家构建出功能类似真实神经元的人工神经元某机构的研究人员利用细菌培育的蛋白质纳米线,成功开发出低电压人工神经元,其电活动与天然脑细胞高度匹配。 蛋白质纳米线的关键作用研究团队使用的秘密成分是从地杆菌中合成的蛋白质纳米线。 这种细菌不仅能够产生电能,其蛋白质纳米线还被用于设计多种高效设备,包括:由汗液驱动的生物膜,可为个人电子设备供电能够嗅出疾病的"电子鼻"几乎可以从任何材料中收集空气中电能的设备应用前景这项技术有望推动以下领域的发展
8月11日,“AI蛋白质预测奠基人”许锦波领衔的分子之心团队宣布,在蛋白质结构预测领域取得一项重要进展。 但目前的AI蛋白结构预测算法普遍需要提前搜索序列库、构建MSA才能进行结构预测。 这一固有路径存在两大局限。 二是并非所有蛋白质都有足够多的同源序列,比如对于孤儿蛋白等小型蛋白质家族,基于MSA的预测方法始终表现不佳。 “我们正在开发一种方法,可以直接从其一级序列预测蛋白质结构,而无需隐含使用任何同源信息,这种方法才可以正确地预测孤儿蛋白的结构。”许锦波表示,分子之心正在对孤儿蛋白等特殊蛋白质结构预测进行深入探索。 随着算法持续进化,关于蛋白质复合物结构、蛋白质和其他分子的相关作用、抗体抗原相互作用等蛋白质结构预测的其他难题,将逐一得解。
蛋白质通常被称为人体的工作分子。一个成年人的身体约有20000多种不同类型的蛋白质,每种蛋白质都涉及人类生命所必需的许多功能,许多重要的细胞过程也涉及到蛋白质的物理相互作用。 因此,确定蛋白质的四级结构为理解复合物功能的分子机理提供了重要的见识。 为了帮助更好地理解蛋白质在体内的相互作用,普渡大学的研究人员设计了一种新颖的方法,利用深度学习来更好地了解蛋白质在体内的相互作用方式,从而为产生与各种疾病有关的蛋白质相互作用的准确结构模型铺平了道路,并为设计针对蛋白质相互作用的更好药物铺平了道路 为了了解蛋白质复合物功能的分子机制,生物学家一直在使用诸如X射线和显微镜的实验方法,但这是费时和资源密集的工作。 为了评估蛋白质对接模型,DOVE使用3D体素扫描模型的蛋白质-蛋白质界面,并考虑原子相互作用类型及其能量贡献作为应用于神经网络的输入特征。
通过开发可以回顾从基因组数据库中选出的蛋白质信息的机器学习模型,研究人员发现了用于构建人工蛋白质的相对简单的设计规则。 当团队在实验室中构建这些人造蛋白质时,他们发现它们的化学反应非常出色,可以与自然界中的蛋白质媲美。 ? 人工智能学习蛋白设计规则 蛋白质由成百上千个氨基酸组成,这些氨基酸序列决定了蛋白质的结构和功能。 但是,仅了解如何构建这些序列以创建新蛋白的方法一直是一项挑战。过去的工作导致了可以指定结构的方法,但是功能却更加难以捉摸。 该模型显示,仅氨基酸位置的保守性和氨基酸对进化中的相关性就足以预测具有蛋白质家族特性的新人工序列。 Ranganathan说,通常认为要构建某种东西,首先必须深刻理解它的工作原理。 但是,如果有足够的数据示例,则可以使用深度学习方法来学习设计规则,即使正在了解其工作原理或以这种方式构建的原因也是如此。
这项创新基于该团队早期利用产电细菌制造蛋白质纳米线的研究。这一新方法可能为以生命系统的效率运行、甚至能与生物组织直接连接的计算机铺平道路。 这个中间放大步骤既增加了功耗,也增加了电路的复杂性,但使用我们的低电压神经元构建的传感器可能完全不需要任何放大。” 该团队新型低功耗神经元的秘密成分是一种由非凡的细菌硫还原地杆菌合成的蛋白质纳米线,这种细菌还具有产电的超能力。 Yao及其同事们已利用这种细菌的蛋白质纳米线设计了一系列极其高效的设备:一种可以用汗水为个人电子设备供电的生物膜;一种可以“嗅出”疾病的“电子鼻”;以及一种几乎可以用任何材料建造、可以从空气中获取电能的设备
原核蛋白表达宿主菌株与表达载体的选择1. C41、C43 等突变株:对有毒或难表达蛋白更为耐受,常用于膜蛋白或代谢负担较大的蛋白。2. 此外,对于碱性蛋白,可构建融合保护多肽(如GST、Nus、MBP等)融合策略,通过保护作用避免降解。结合连接肽和酶切位点,既保留表达产量,又能后续切除保护模块。2. 例如使用携带冷激蛋白promoter的表达载体,在较低温度(如11℃)下诱导,可显著提高可溶表达几率。蛋白表达定制服务1. 构建表达载体:选择合适promoter(如T7、低温诱导promoter)与融合伴体;4. 小规模表达筛选:不同诱导温度、菌株、培养方式下检测表达产量与溶解性;5. 大规模表达与裂解;6.
我们在遇到一些新的蛋白的时候,经常需要去了解这个蛋白的功能。如果是一个新的还没有功能注释的蛋白,一般数据库就用不了了。这个时候就可以使用 NetGo 来对蛋白的序列进行功能注释了。 ? NetGo基于三重信息来对蛋白序列进行功能预测: 基于已知的功能信息信息(GO数据库) 基于STRING蛋白相互作用数据库进行注释 如果没有互作蛋白的可以进行同源转换进行注释。 数据库评价 对于蛋白功能预测的话,已知的蛋白基本上都已经基于GO预测好了。如果我们研究的是已知常规蛋白的话,其实可以去类似Genecards或NCBI的gene数据库直接看的。 这个数据库更多的可以用于新发现的蛋白的预测,或者说一个基因不同转录本之间的研究,看有没有功能的区别。
在生物技术与分子生物学中,原核蛋白表达体系(尤其是大肠杆菌蛋白表达)因操作简便、生长速度快、成本低廉,是获取重组蛋白的重要途径。 然而,在高水平表达时,目标蛋白往往以包涵体蛋白形式沉淀,形成不可溶的聚集物。这种现象虽影响生物活性蛋白得率,但其高表达量、易纯化等特性使得包涵体蛋白纯化成为不可忽视的技术路线。 因此,在工程过程中,提升可溶性蛋白表达与完善包涵体蛋白的纯化与复性策略,是实现高效、活性蛋白回收的关键。可溶性蛋白表达策略避免目标蛋白形成沉淀、提高可溶性表达是首选路径。 4、伴侣蛋白共表达:如 DnaK–DnaJ–GroEL/ES 蛋白折叠体系,以及过氧化还原系统 DsbA/DsbC 可改善折叠,尤其针对含多二硫键蛋白。 通过上述策略,可显著在原核蛋白表达 / 大肠杆菌蛋白表达系统中提升可溶性蛋白表达比率,从而降低进入包涵体途径的蛋白量。包涵体蛋白纯化流程当可溶性表达不足时,包涵体表达成为高产获取目标蛋白的重要替代。
本文提出了 ColAttn 方法,该方法利用蛋白质语言模型识别复合物的间相互作用,并进一步结合多序列比对方法来提升结构预测准确性。 1 介绍 现在有许多深度学习模型在计算生物结构。 AlphaFold-Multimer 就提升了蛋白质复合物结构的预测水平,但其准确性依然取决于多序列比对(MSA)结果。 相对于 AlphaFold2,AlphaFold-Multimer 需要构建间相互作用 MSA,但如何构建依旧是一个问题。 同时,蛋白质语言模型也在不同的工作中被广泛应用,它可以捕捉到序列中的约束和共进化信息。 图 6:不同层上 DockQ 得分 4 总结 本文基于预训练蛋白语言模型,探索了一些 MSA 配对算法构建有效间相互作用的效果,这篇文章也是首次将蛋白语言模型用来构造联合 MSA,实验结果证明本文提出的
其优势在于适合快速验证蛋白功能、小规模制备和结构分析。例如,研究者常在 HEK293E 中快速获得融合蛋白或重组受体蛋白,用于体外功能实验。 稳定表达系统(SGE)需构建稳定整合表达载体并筛选克隆,具有长期稳定表达的优势,适合大规模生产。CHO细胞常通过DHFR基因共转染策略进行选择和抗体放大。3. 哺乳动物细胞蛋白表达载体构建与优化策略1. 启动子与调控元素常用启动子包括 CMV、SV40,以及非病毒来源 EF-1α 等。可在载体中增加 WPRE 元件以增强转录效率促进目标基因表达。2. 哺乳动物蛋白表达流程与纯化过程1. 基因合成与载体构建合成优化后的目标基因,克隆至表达载体中,载体含启动子、信号肽、标签(如His标签)等。2. 哺乳动物细胞蛋白表达系统因其天然的折叠与修饰能力,成为表达结构复杂、功能敏感蛋白的首选平台。
无细胞蛋白表达系统的原理无细胞蛋白表达系统是一种在体外重组蛋白合成的方法,通常以大肠杆菌、酵母或哺乳动物细胞为来源,通过提取细胞裂解液,保留其中的转录和翻译机制,构建体外表达体系。 无细胞蛋白表达系统在膜蛋白研究中的应用1. 膜蛋白的表达和纯化膜蛋白由于其疏水性和结构复杂性,传统的细胞表达系统难以高效表达和纯化。 膜蛋白的功能研究无细胞系统能够在体外合成具有功能的膜蛋白,如离子通道、受体和转运蛋白等,为其功能研究提供了便利。通过与膜片钳技术、荧光标记和质谱分析等方法结合,可以深入探讨膜蛋白的功能机制。4. 膜蛋白的药物筛选膜蛋白是许多药物的靶点,如G蛋白偶联受体(GPCR)和离子通道等。无细胞系统能够在体外合成目标膜蛋白,并进行高通量药物筛选,为新药的开发提供了有效的平台。 此外,结合计算模拟和结构生物学技术,也有助于深入探讨膜蛋白的功能机制。无细胞蛋白表达系统作为一种高效、可控和灵活的蛋白合成方法,在膜蛋白研究中具有重要应用价值。
启动子强度决定了转录起始效率,而mRNA稳定性、翻译效率及蛋白降解速率共同决定了最终蛋白表达水平。标准操作流程第一阶段:载体构建与验证目标基因cDNA需经序列验证后克隆至表达载体。 构建完成的载体需通过酶切鉴定和测序验证,确保阅读框正确且无突变。第二阶段:细胞转染与筛选选取适宜宿主细胞(如HEK293、CHO或特定细胞系),采用脂质体转染、电穿孔或慢病毒转导等方法导入表达载体。 第四阶段:表达水平鉴定通过qRT-PCR检测mRNA表达水平,Western blot分析蛋白表达。对于分泌型蛋白,可采用ELISA定量检测培养上清中目标蛋白浓度。 -UTR序列影响表达稳定性常见问题处理:表达沉默:更换载体骨架或添加绝缘子元件细胞毒性:采用诱导型表达系统表达不稳定:优化筛选压力维持策略应用领域基础研究应用:基因功能获得性研究信号通路上下游关系解析蛋白相互作用网络构建转化研究应用 :药物靶点验证疾病模型构建生物标志物发现生产应用:重组蛋白生产病毒载体包装细胞治疗产品开发随着CRISPR/Cas9等基因编辑技术的发展,定点整合技术正逐步取代随机整合,实现更精准的表达调控。
该研究提出了一种基于Transformer和门控卷积残差神经网络的集成框架EnsemPPIS,仅需要蛋白质的序列信息即可准确识别潜在的蛋白质-蛋白质相互作用(PPI)位点。 所构建的模型不仅有效提取残基所处的全局和局部序列环境特征,还利用Transformer算法的自注意力机制从蛋白质序列上学习残基相互作用信息,进而使用集成学习策略将多种特征进行有机整合,在多个基准数据集上实现了卓越的预测性能 此外,作者还构建了一个在线预测平台,网址为http://idrblab.org/ensemppis。 结果与讨论 模型框架 该研究所构建的EnsemPPIS模型框架如图1所示,其通过三个步骤预测PPI位点,包括ProtBERT编码、特征学习和预测。 相比之下,研究人员所构建的EnsemPPIS只需要蛋白质序列信息,不受任何结构误差的影响(如图2C中红色虚线所示)。
然而,由于异源蛋白表达过程中常出现蛋白易聚集成包涵体、降解或表达水平低等问题,导致可溶性表达效率不高。因此,实现重组蛋白在 E. coli 中的可溶表达,是确保后续纯化、结构功能研究与应用的关键。 可溶性蛋白表达的背景与挑战E. coli 表达系统是目前广泛使用的重组蛋白表达平台,具有成熟的遗传工具、可高密度培养、表达速率快、成本低廉等显著优势。 ③.蛋白毒性,对宿主生长造成抑制,影响表达。④.蛋白降解,长时间表达或表达条件不当,宿主蛋白酶作用造成目标蛋白损耗。因此,提升可溶性表达,对科研与产业都具有重要意义。 分泌表达:信号肽与分泌通路应用通过优化信号肽(如 PelB、MalE)引导目标蛋白进入周质空间,减少蛋白酶降解并利于折叠。 构建表达载体 选择合适载体(如 pET 系列);融合标签后设置切割位点(TEV/SUMO/EK) 准备多种版本(有/无标签)3.
重组IL-1β蛋白(Interleukin-1β,白介素-1β,AbMole,M21094)是一种通过基因工程表达的重要促炎细胞因子,在免疫调控和炎症研究中具有核心作用。 IL-1β通过结合IL-1RI(I型IL-1受体)并招募辅助蛋白IL-1RAcP,激活NF-κB信号通路,进而调控下游炎症因子的释放[1]。 另外,重组IL-1β蛋白(Interleukin-1β,白介素-1β)还可用于人源化单抗的筛选,例如在抗IL-1β单克隆抗体的开发中,重组IL-1β用于验证抗体的中和效果[6]。 范例详解Mol Med Rep. 2023 Nov;28(5):202.南京医科大学的科研人员在上述论文中使用了AbMole提供的重组IL-1β蛋白(白介素-1β,AbMole,M21094)。 研究采用体内(小鼠内侧半月板失稳模型,DMM)和体外(IL-1β诱导软骨细胞OA模型)实验验证了:乙酰姜酮可促进软骨细胞活力、增加细胞外基质(ECM)成分的表达、减少金属蛋白酶(ADAMTS-4、MMP13
数据导入: 蛋白互作节点信息导入、其他注释信息的导入 3. 顺接上节RNA-seq入门实战(九):PPI蛋白互作网络的构建——STRING数据库的使用,在得到目的基因的蛋白互作关系数据后,可以将数据导入Cytoscape软件进行个性化的可视化操作,本节中介绍Cytoscape 数据导入 2.1 蛋白互作节点信息导入 上节中在STRING网站中下载的sting_interactions_short.tsv文件(或者利用STINGdb包中得到的sting_link.csv文件)包含了蛋白互作节点的各项信息
酵母是真核生物中最常用的异源蛋白表达平台之一。 酵母蛋白表达宿主系统1、酿酒酵母 (S. cerevisiae)作为最早被用于异源蛋白表达的真核宿主,酿酒酵母的遗传背景清晰,分子生物学工具完善,适合基础研究和结构相对简单的蛋白表达。 折叠效率与伴侣蛋白共表达在高水平表达过程中,外源蛋白容易在内质网中错误折叠或聚集,引发内质网应激反应。 为提高蛋白折叠与分泌效率,研究者常采用以下策略:共表达分子伴侣蛋白(如 BiP、PDI),增强折叠能力;诱导内质网未折叠蛋白反应(UPR),提高宿主细胞对折叠负担的耐受性;通过基因工程方式优化宿主的折叠环境 未来,随着模型构建与调控元件设计技术的进展,以及 CRISPR/Cas 技术在酵母中的应用,酵母表达平台有望实现更精细、更高产且更经济的蛋白制造。
蛋白质的计算设计和突变可以获得新的功能,这一直是生物工程的核心。随着越来越多基于AI的算法出现,整个领域也在关注快速进化任何蛋白质序列的算法。 本研究开发了一个新的模型EVOLVEpro,一种结合蛋白大语言模型(PLMs),主动学习和回归模型的创新蛋白质工程方法,能够在仅需少量实验数据的情况下快速提升蛋白的活性。 EVOLVEpro的工作原理是利用PLM来编码蛋白质序列至连续的潜在空间,通过回归模型学习蛋白活性与潜在空间的映射关系。 通过对CRISPR核酸酶、编辑酶Bxb1、T7 RNA聚合酶等其他蛋白的优化,EVOLVEpro也展现出其对多种蛋白活性的提升潜力。 研究结果表明,EVOLVEpro是一种强大的普适性工具,可以在生物学和医学的蛋白质工程中广泛应用,尤其适用于那些难以通过高通量筛选的蛋白进化任务。
研究人员提出了一种通用方法,设计可结合无结构蛋白区域的结合蛋白,其侧链能够嵌入互补的结合口袋中。研究人员成功设计了39种结合多种多样无结构靶标的蛋白,其中34种设计的解离常数在百皮摩尔至百纳摩尔之间。 尽管已有研究尝试泛化某些天然蛋白的结合模式,但开发具有全新特异性的结合蛋白仍然困难。 研究人员提出了一种结合物理建模与深度学习的设计策略,先使用Rosetta方法生成多个重复单元结构的蛋白骨架,再通过RFdiffusion方法实现结合口袋的重组与多样化,从而构建能够适配各种序列与构象的结合蛋白模板库 结果 模板库的构建 研究人员设计了能包裹肽链、与目标氨基酸形成氢键和疏水作用的重复蛋白骨架,针对二肽重复序列(如LK、RT、YD、PV、GA)进行构建。 无结构区域的匹配与优化 利用构建的模板库,研究人员开发了一种“线程+精修”的两步法,首先将靶序列映射至所有模板以找到最佳匹配片段,接着通过一侧或双侧扩散策略优化结合界面。
随着蛋白研究需求不断增加,研究人员需要更快的蛋白表达速度以及更高通量的蛋白筛选能力。 什么是无细胞蛋白表达系统无细胞蛋白表达系统是一种在体外环境中完成蛋白合成的技术。该系统通过提取细胞中的转录翻译组件,在体外重建蛋白合成所需的分子机器。 无细胞蛋白表达系统的优势相比传统细胞蛋白表达系统,无细胞蛋白表达系统具有多个优势。快速表达传统蛋白表达系统通常需要数天时间完成培养和诱导,而无细胞蛋白表达系统可以在数小时内完成蛋白合成。 高通量蛋白筛选在蛋白工程研究中,研究人员往往需要筛选大量蛋白突变体。无细胞蛋白筛选系统能够在微量反应体系中同时表达多个蛋白构建体。 适用于复杂蛋白某些膜蛋白或毒性蛋白在细胞表达系统中难以表达,而无细胞蛋白表达系统可以绕过细胞生长限制。