搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

ESM3蛋白质语言模型cookbook（3）
前两章我们介绍了ESM3和ESM-C模型 ESM3蛋白质语言模型cookbook（1） ESM3蛋白质语言模型cookbook（2） ·Hayes论文图 ESM3 能够在蛋白质的序列、结构和功能之间进行联合推理，因此我们可以构建新的提示方式，以比许多其他生物语言模型更高的控制水平引导模型生成蛋白质。我们将从 PDB 数据库中的 1qy3 序列和结构片段构建提示。以下代码从 PDB 获取数据，然后使用 ESM3 的分词器将序列和结构转换为可以传入模型的 token。（pdb id：1qy3，链：A），并且用esm3模型的编码器将其转化为序列和结构的token表示，用于后续提示词的构建。 gfp蛋白质结构接下来我们再去看看pdb id为1qy3 的蛋白质结构是什么样子的呢？
3300编辑于 2026-04-17
细菌蛋白纳米线构建低功耗人工神经元
科学家构建出功能类似真实神经元的人工神经元某机构的研究人员利用细菌培育的蛋白质纳米线，成功开发出低电压人工神经元，其电活动与天然脑细胞高度匹配。蛋白质纳米线的关键作用研究团队使用的秘密成分是从地杆菌中合成的蛋白质纳米线。这种细菌不仅能够产生电能，其蛋白质纳米线还被用于设计多种高效设备，包括：由汗液驱动的生物膜，可为个人电子设备供电能够嗅出疾病的"电子鼻"几乎可以从任何材料中收集空气中电能的设备应用前景这项技术有望推动以下领域的发展
19710编辑于 2025-10-29
来自专栏Y大宽
1️⃣序列获取(3)：蛋白质序列获取
EXProt :database for EXPerimentally verified Protein functions ps，写到这里，安利一个航母网址https://www.expasy.org/ 3 UniProtKB：不能再详细 Swiss-Prot 数据来源核酸数据库翻译推导蛋白质数据库PIR挑选科学文献摘录研究人员直接提交的蛋白序列特点每一条序列包括核心数据和注释两类,
68510发布于 2019-01-28
来自专栏DrugOne
加速构建蛋白质元宇宙！分子之心借MoleculeOS引擎完成AI蛋白预测三级迭代
8月11日，“AI蛋白质预测奠基人”许锦波领衔的分子之心团队宣布，在蛋白质结构预测领域取得一项重要进展。但目前的AI蛋白结构预测算法普遍需要提前搜索序列库、构建MSA才能进行结构预测。这一固有路径存在两大局限。比如，UniRef100目前有约3亿个序列，如果采用RaptorX、trRosetta、AlphaFold、RoseTTAFold等传统方法，使用同源序列和共进化信息作为输入，需要巨量的计算时间和算力成本二是并非所有蛋白质都有足够多的同源序列，比如对于孤儿蛋白等小型蛋白质家族，基于MSA的预测方法始终表现不佳。 Nat Mach Intell 3, 601–609 (2021). https://doi.org/10.1038/s42256-021-00348-5
63520编辑于 2022-11-28
来自专栏ATYUN订阅号
AI改善蛋白质相互作用的结构建模
蛋白质通常被称为人体的工作分子。一个成年人的身体约有20000多种不同类型的蛋白质，每种蛋白质都涉及人类生命所必需的许多功能，许多重要的细胞过程也涉及到蛋白质的物理相互作用。为了帮助更好地理解蛋白质在体内的相互作用，普渡大学的研究人员设计了一种新颖的方法，利用深度学习来更好地了解蛋白质在体内的相互作用方式，从而为产生与各种疾病有关的蛋白质相互作用的准确结构模型铺平了道路，并为设计针对蛋白质相互作用的更好药物铺平了道路为了评估蛋白质对接模型，DOVE使用3D体素扫描模型的蛋白质-蛋白质界面，并考虑原子相互作用类型及其能量贡献作为应用于神经网络的输入特征。由普渡大学研究人员创建的DOVE捕获具有3D框的蛋白质对接模型界面的结构和能量特征，并使用3D卷积神经网络判断该模型是正确的还是错误的。图片来源：木原大辅/普渡大学研究人员表示：“我们的工作是在生物信息学领域的一个重大进步，这可能是研究人员首次成功使用深度学习和3D功能来快速了解某些蛋白质模型的有效性。
72410发布于 2020-02-14
来自专栏DrugOne
Science | 机器学习揭示了构建人造蛋白质的秘诀
通过开发可以回顾从基因组数据库中选出的蛋白质信息的机器学习模型，研究人员发现了用于构建人工蛋白质的相对简单的设计规则。当团队在实验室中构建这些人造蛋白质时，他们发现它们的化学反应非常出色，可以与自然界中的蛋白质媲美。 ? 人工智能学习蛋白设计规则蛋白质由成百上千个氨基酸组成，这些氨基酸序列决定了蛋白质的结构和功能。但是，仅了解如何构建这些序列以创建新蛋白的方法一直是一项挑战。过去的工作导致了可以指定结构的方法，但是功能却更加难以捉摸。该模型显示，仅氨基酸位置的保守性和氨基酸对进化中的相关性就足以预测具有蛋白质家族特性的新人工序列。 Ranganathan说，通常认为要构建某种东西，首先必须深刻理解它的工作原理。但是，如果有足够的数据示例，则可以使用深度学习方法来学习设计规则，即使正在了解其工作原理或以这种方式构建的原因也是如此。
61530发布于 2021-02-01
呼吸道合胞病毒（HRSVBRSV）核心抗原深度解析：Fusion蛋白、G蛋白及PreF3蛋白的科研试剂应用
三、 PreF3蛋白：稳定融合前构象的抗原设计突破PreF3蛋白并非病毒基因组直接编码的天然蛋白，而是基于F蛋白结构生物学研究而精心设计的重组蛋白工程产物，特指稳定在融合前构象（Prefusion conformation 技术特点与优势：PreF3蛋白作为科研试剂，其最大优势在于保持了天然PreF构象的抗原表位完整性。与自发转变为PostF的野生型F蛋白或早期PreF设计相比，PreF3蛋白具有更高的蛋白稳定性和均一性，能更有效地诱导产生针对关键中和表位的高效抗体。作为科研试剂的核心价值：PreF3蛋白是目前研究HRSV/BRSV F蛋白相关生物学和免疫学的“金标准”抗原。虽然F蛋白相对保守，但G蛋白差异显著，而PreF3蛋白的设计也需针对不同亚型进行序列优化。
23010编辑于 2025-12-15
来自专栏R语言可视化
两蛋白间的分子对接3—使用AlphaFold进行
两蛋白间的分子对接3—使用AlphaFold进行据说AlphaFold进行分子对接比传统的蛋白分子工具如zdock、hdock的对接效果更好。输出PDB格式文件3.pymol中进行可视化操作安装ppi.py脚本文件，Choose file选择ppi.py这个脚本，安装脚本ppi.py这段 Python 脚本是专门在 PyMOL 中执行的，用来分析和可视化蛋白质 -蛋白质相互作用（PPI），重点包括：π-π stacking（芳香环之间的堆叠）Salt bridge（盐桥）Hydrogen bonds（氢键）同时，脚本还设置了可视化参数，便于展示结果。 y1,y2,y3): import numpy as np #print(x1,x2,x3,y1,y2,y3) B1, B2, B3 = [x1[0] - x2[0], x1[1] - [1] - y3[1], y1[2] - y3[2]] n2 = [D2 * E3 - E2 * D3, D3 * E1 - E3 * D1, D1 * E2 - E1 * D2] dot_product
3.4K11编辑于 2025-04-08
ESM3蛋白质语言模型cookbook（1）
一.背景介绍对于蛋白质序列的研究和结构的研究现在变得越来越热门，所谓工欲善其事，必先利其器，所以今天我们就来介绍一下ESM3, 使用ESM3可以对蛋白质进行特征提取，无论是之后再接入各种各样的神经网络 5 亿年进化并实测设计出全新的绿色荧光蛋白，帮助科学家按需创造酶、抗体及碳捕获蛋白等功能分子，标志着蛋白质语言模型从“预测”迈向“可控生成”时代。 ESM-3更是一个多模态的蛋白质语言模型，结合了蛋白质的结构和功能等特征。因为蛋白质由氨基酸组成，而每一种氨基酸又由不同的原子组成，所以这里是原子坐标，如果没有这个原子，那么其坐标则为nan 3: 每个原子的(x,y,z)坐标打印一下看看咯： print(protein.coordinates protein.sasa = protein_chain.sasa() plt.plot(protein.sasa) 我们还可以将这些SASA值映射到结构的3D可视化上，利用我们拥有这种蛋白质的3D坐标这一事实
2400编辑于 2026-04-17
ESM3蛋白质语言模型cookbook（2）
上一张我们讲解了最基础的ESMProtein类： ESM3蛋白质语言模型cookbook（1）今天我们继续介绍第二章的内容：使用ESM-C模型获取蛋白质的特征表达（embedding），进行一个简单蛋白质序列分类的任务 yep，寒武纪大模型，所以这是一个很powerful的蛋白质模型。 ESM-C（寒武纪）是他们的旗舰ESM3生成模型的平行模型家族。 ESM3专注于可控的蛋白质生成，而ESM C专注于创建蛋白质潜在生物学的表示。所以我们这次将会通过ESM-C蛋白质语言模型去提取蛋白质序列的embedding表示也就是用特征向量来表示蛋白质序列。接下来构建一个完整的画图类：这个方法它首先提取每条序列在指定层的embedding向量，对这些高维向量使用PCA降维到二维以便可视化；然后通过K-Means聚类并计算Rand Index来衡量聚类结果与真实类别
2600编辑于 2026-04-17
利用细菌蛋白纳米线构建的低电压人工神经元
这项创新基于该团队早期利用产电细菌制造蛋白质纳米线的研究。这一新方法可能为以生命系统的效率运行、甚至能与生物组织直接连接的计算机铺平道路。这个中间放大步骤既增加了功耗，也增加了电路的复杂性，但使用我们的低电压神经元构建的传感器可能完全不需要任何放大。” 该团队新型低功耗神经元的秘密成分是一种由非凡的细菌硫还原地杆菌合成的蛋白质纳米线，这种细菌还具有产电的超能力。 Yao及其同事们已利用这种细菌的蛋白质纳米线设计了一系列极其高效的设备：一种可以用汗水为个人电子设备供电的生物膜；一种可以“嗅出”疾病的“电子鼻”；以及一种几乎可以用任何材料建造、可以从空气中获取电能的设备
9010编辑于 2026-01-21
来自专栏生信技能树
蛋白质组学第3期-蛋白质组学的三大元素
上周我们公布了，蛋白质组学习小组起飞啦！短短几天就获得了250多小伙伴的支持，让我们也更有信心的带领大家掌握一个蛋白质组学数据处理的实战，前面两期我们分享的是：蛋白质组学第1期-认识基础概念蛋白质组学第2期-认识蛋白质组学原始数据 ?
2.9K44发布于 2019-07-26
靶向免疫细胞活化的关键调控组件：CD3E&CD3D异二聚体Fc融合蛋白的构建与应用
二、工程化策略：构建CD3E&CD3D异二聚体Fc融合蛋白为获得结构稳定、功能明确的CD3E/CD3D异二聚体研究工具，采用重组蛋白工程技术进行体外构建成为一种高效策略。在本构建策略中，采用两种不同亚型的羊驼源Fc片段分别与CD3ε和CD3δ的胞外域融合。 2.功能标签的引入：在构建体中引入羊驼源Fc标签具有多重优势。其一，该Fc标签可作为通用的亲和纯化标签，利用蛋白A或蛋白G层析柱实现重组蛋白的高效、一步法纯化，极大简化了下游工艺。 2.治疗性抗体与双特异性分子的开发与评价：CD3是构建T细胞重定向双特异性抗体的核心靶点之一。四、总结与展望CD3E&CD3D异二聚体Fc融合蛋白的成功构建，为T细胞生物学研究领域提供了一个结构明确、功能可靠的重要工具。
13710编辑于 2026-02-11
来自专栏代码编写世界
CMake构建学习笔记3-libpng库的构建
，指定构建类型 cmake --build . --config RelWithDebInfo # 安装阶段，指定构建类型和安装目标 cmake --build . CMAKE_BUILD_TYPE是设置构建的类型，这里使用的是RelWithDebInfo，也就是Release带调试信息的类型。 libpng是需要依赖于zlib进行构建的，而在上一篇笔记中我们已经在这个目录中安装了zlib，那么只要将这个变量指定这个目录，CMake进行构建的时候就会自动找到zlib的依赖项，从而简化我们的配置过程如下图所示： PNG_TESTS和PNG_STATIC是libpng提供的构建选项，将它们都设置成OFF，表示不用构建测试程序，也不同构建静态库。
37610编辑于 2024-12-14
【辰辉创聚生物】重组蛋白表达纯化|蛋白表达定制|蛋白修饰|原核表达蛋白
宿主菌株的选择BL21 系列菌株：最常用的表达宿主，如 BL21(DE3)，因缺乏 Lon 与 OmpT 蛋白酶，可减少重组蛋白降解，配合 T7 表达系统可实现高水平表达。此外，对于碱性蛋白，可构建融合保护多肽（如GST、Nus、MBP等）融合策略，通过保护作用避免降解。结合连接肽和酶切位点，既保留表达产量，又能后续切除保护模块。2. 3. 小规模表达测试与优化在大规模表达前，需进行小规模试表达检测表达溶解性、条件优化（诱导温度、宿主菌株、表达载体等）。目标蛋白及修饰/标签设计：根据实验需求确定是否添加His-tag、GST等融合标签，是否加入酶切位点；2. 基因合成与密码子优化：针对E. coli 系统进行优化，提升表达效率；3. 构建表达载体：选择合适promoter（如T7、低温诱导promoter）与融合伴体；4. 小规模表达筛选：不同诱导温度、菌株、培养方式下检测表达产量与溶解性；5. 大规模表达与裂解；6.
64510编辑于 2025-08-25
来自专栏火星娃统计
mlr3_学习器构建
mlr3_学习器构建概述 ? 见到四十三次日落，需要一天见到那年的夏天，需要一年看到彗星划过夜空，需要一甲子，却需要到时间尽头 mlr3::Learner类的对象为r中许多流行的机器学习算法提供了统一的接口。 mlr3包含一些基本的算法 mlr_learners_classif.featureless mlr_learners_classif.rpart mlr_learners_regr.featureless Kriging 更多的算法再mlr3extralearners仓库中创建learner 略，暂定更新与后续预置的learner library("mlr3learners") mlr_learners lrn("classif.rpart", id = "rp", cp = 0.001) 结束语学习器的构建其实在这里并没有说明，需要明白的是，一个算法的构建涉及的东西较多，因此放在后续的章节。
1.5K20发布于 2021-01-19
来自专栏技术杂记
Docker 中构建 Jenkins3
Pushed 6234bb424ca2: Pushed b31b78b6c124: Pushed 7e844a128314: Pushed 6842d0a24c05: Pushed 9afbe4c3ddc8
47030编辑于 2022-01-21
来自专栏技术杂记
Rails 构建评论功能（3）
CreateComments: migrated (0.0036s) ========================== [root@h202 blog]# ---- 关联评论评论在创表的过程中已经构建了与
1.4K30发布于 2021-10-20
来自专栏DrugIntel
AFsample3：AlphaFold3驱动的蛋白多重构象状态生成与选择
多参数优化的采样系统为平衡构象质量与计算效率，AFsample3建立了多参数优化的采样体系：采样规模：针对238个靶标蛋白的测试表明，多数蛋白仅需生成300个模型即可获得高质量交替构象，较AFsample2 ，构建相似性矩阵；通过PCA降维和k-means聚类，将构象 ensemble 划分为k个结构簇；采用“高置信度优先+最大差异性”策略排序簇代表：先选择置信度最高的簇，后续依次选择与已选簇TM-score 跨场景鲁棒性优异 AFsample3在不同构象差异和序列长度的目标蛋白中均表现稳定：针对构象相似度较高（TM>0.5）的目标蛋白，其交替构象预测准确率提升最为显著；对于长序列蛋白（序列长度>1000 该协议可直接应用于未知构象蛋白的研究，为孤儿蛋白、新发现蛋白的构象解析提供了可行方案，显著拓展了多构象建模的应用场景。 3. 五、总结 AFsample3作为基于AlphaFold3的增强采样框架，通过创新的MSA随机掩码策略、DiSco无参考筛选协议和多参数优化系统，在多构象蛋白质建模领域实现了技术突破。
21310编辑于 2026-01-27
来自专栏DrugOne
AFsample3：AlphaFold3驱动的蛋白多重构象状态生成与选择
多参数优化的采样系统为平衡构象质量与计算效率，AFsample3建立了多参数优化的采样体系：采样规模：针对238个靶标蛋白的测试表明，多数蛋白仅需生成300个模型即可获得高质量交替构象，较AFsample2 ，构建相似性矩阵；通过PCA降维和k-means聚类，将构象 ensemble 划分为k个结构簇；采用“高置信度优先+最大差异性”策略排序簇代表：先选择置信度最高的簇，后续依次选择与已选簇TM-score 跨场景鲁棒性优异 AFsample3在不同构象差异和序列长度的目标蛋白中均表现稳定：针对构象相似度较高（TM>0.5）的目标蛋白，其交替构象预测准确率提升最为显著；对于长序列蛋白（序列长度>1000 该协议可直接应用于未知构象蛋白的研究，为孤儿蛋白、新发现蛋白的构象解析提供了可行方案，显著拓展了多构象建模的应用场景。 3. 五、总结 AFsample3作为基于AlphaFold3的增强采样框架，通过创新的MSA随机掩码策略、DiSco无参考筛选协议和多参数优化系统，在多构象蛋白质建模领域实现了技术突破。
14710编辑于 2026-01-28

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

ESM3蛋白质语言模型cookbook（3）

细菌蛋白纳米线构建低功耗人工神经元

1️⃣序列获取(3)：蛋白质序列获取

加速构建蛋白质元宇宙！分子之心借MoleculeOS引擎完成AI蛋白预测三级迭代

AI改善蛋白质相互作用的结构建模

Science | 机器学习揭示了构建人造蛋白质的秘诀

呼吸道合胞病毒（HRSVBRSV）核心抗原深度解析：Fusion蛋白、G蛋白及PreF3蛋白的科研试剂应用

两蛋白间的分子对接3—使用AlphaFold进行

ESM3蛋白质语言模型cookbook（1）

ESM3蛋白质语言模型cookbook（2）

利用细菌蛋白纳米线构建的低电压人工神经元

蛋白质组学第3期-蛋白质组学的三大元素

靶向免疫细胞活化的关键调控组件：CD3E&CD3D异二聚体Fc融合蛋白的构建与应用

CMake构建学习笔记3-libpng库的构建

【辰辉创聚生物】重组蛋白表达纯化|蛋白表达定制|蛋白修饰|原核表达蛋白

mlr3_学习器构建

Docker 中构建 Jenkins3

Rails 构建评论功能（3）

AFsample3：AlphaFold3驱动的蛋白多重构象状态生成与选择

AFsample3：AlphaFold3驱动的蛋白多重构象状态生成与选择

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐