Tom2Code
蛋白语言模型能设计 AAV 吗?关键不在生成,而在如何兼顾可行性与新颖性
原创
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
Tom2Code
社区首页
>
专栏
>
蛋白语言模型能设计 AAV 吗?关键不在生成,而在如何兼顾可行性与新颖性
蛋白语言模型能设计 AAV 吗?关键不在生成,而在如何兼顾可行性与新颖性
Tom2Code
关注
发布于 2026-04-16 11:05:01
发布于 2026-04-16 11:05:01
69
0
举报
概述
这篇论文的核心目标,是在 AAV2 capsid 的局部可变区域中,用“蛋白语言模型微调 + 强化学习奖励引导”去生成既有功能可行性、又尽量跳出训练分布的新序列;它最重要的贡献不是单纯把模型换成了 PLM,而是把“可行性约束”和“新颖性驱动”同时放进生成框架里,并进一步加上一个基于极性和电荷的候选筛选策略。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
人工智能
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
人工智能
#蛋白质语言模型
#AAV
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
目录
1. 一句话概括
2. 研究背景与问题提出
3. 核心创新点
创新点 1:把 AAV capsid 生成从“单纯微调”推进到“微调后再强化学习引导”
创新点 2:奖励函数同时编码“可行性”和“新颖性”
创新点 3:训练时只对可变窗口计算损失,避免模型被不变区域“带偏”
创新点 4:候选筛选不再只看 predicted viability,而引入“正交”的生物物理筛选框架
创新点 5:它把“生成—探索—筛选”连成了完整工作流
4. 方法与技术路线拆解
输入
处理过程:第一阶段——监督微调
处理过程:第二阶段——强化学习引导
输出
5. 关键实验与结果解读
结果 1:预训练 PLM 单独用,几乎没有实际设计价值
结果 2:单纯 fine-tuning,能把“可行性”学回来,但仍带着训练集偏见
结果 3:RL 的效果不是“生成更多 unique 序列”,而是“把生成重心推向更远的新颖区域”
结果 4:模型不是盲目乱变,而是在“允许变”的地方更激进地变
结果 5:最终候选筛选体现了作者对“实验可落地性”的考虑
6. 论文的局限性与可商榷之处
局限性 1:本文的“功能性”主要还是预测出来的,不是新序列的实验验证结果
局限性 2:设计空间只覆盖 AAV2 的局部变异窗口,不是全 capsid de novo 设计
局限性 3:RL 的代价是输出分布显著收缩,可能存在模式集中
局限性 4:novelty 指标是 embedding distance,不等于真实功能新颖性
局限性 5:候选筛选虽然更可解释,但仍然是训练数据间接驱动的
7. 这篇论文的真实价值
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐