
DRUGONE
分子生成模型正在快速推动化学发现与药物设计的发展。近年来,流匹配模型(flow matching)在无条件分子生成任务中已达到领先水平,但在性质引导生成(property-guided generation)方面仍主要由扩散模型占优。
研究人员提出 PropMolFlow,一种基于几何完备 SE(3) 等变流匹配的性质引导分子生成框架。该方法通过整合多种性质嵌入策略,并引入高斯展开机制对标量物性进行结构化编码,实现对分子结构、原子类型、电荷、键级和三维几何的联合生成。在QM9数据集上的系统评估表明,PropMolFlow在性质对齐精度、结构稳定性与化学有效性方面达到与现有最优扩散模型相当甚至更优的性能,同时显著提升采样效率,在更少时间步数下实现更快生成速度。研究人员进一步通过密度泛函理论(DFT)计算对生成分子的性质进行物理验证,并提出分布外(OOD)生成任务,评估模型在稀有性质区域的泛化能力。

深度生成模型为化学发现提供了一种通过统计采样分子结构、降低高昂物理模拟成本的路径。当前主流三维分子生成方法主要依赖等变图神经网络驱动的扩散模型,在几何建模上表现优异。
相比之下,流匹配方法作为新兴范式,在材料、蛋白质和小分子生成任务中展现出更高的采样效率和路径灵活性。然而,在性质引导生成场景下仍存在多重挑战,包括:
研究人员认识到,要实现高可信度的性质可控分子设计,需要在几何完备建模、离散变量建模、性质嵌入机制和物理验证体系之间建立统一框架。
方法
PropMolFlow 基于 FlowMol 架构构建,以几何完备 SE(3) 等变流匹配过程为核心,将分子表示为包含原子类型、电荷、键级和三维坐标的全连接图结构。模型通过联合流匹配过程,同时生成所有分子模态信息。
在性质引导方面,研究人员将标量分子性质映射为高维性质嵌入向量,并设计多种嵌入交互方式(拼接、求和、乘法及其组合),实现性质信息与分子节点特征的深度耦合。同时引入非可训练高斯展开层,将连续性质值转化为局部响应分布,从而增强模型对性质变化的表达能力。最终模型在统一框架下实现几何一致、结构稳定、性质可控的分子生成。
结果
模型框架与生成机制概览
PropMolFlow 在统一流匹配框架中联合建模原子类型、电荷、键级与三维几何结构,通过性质嵌入调控分子生成方向,实现结构与物性的协同生成。

图 1|PropMolFlow 方法总体框架。
性质引导生成性能评估(ID任务)
在训练分布内任务中,PropMolFlow 在多个物性指标(极化率、HOMO–LUMO 间隙、偶极矩、热容等)上实现与最优扩散模型相当或更优的平均绝对误差(MAE)表现。
系统分析表明,性质嵌入策略与高斯展开机制对模型性能影响显著,不同嵌入方式可导致超过 40% 的性能差异,验证了系统化设计的重要性。
结构稳定性与生成效率
PropMolFlow 在多项结构有效性指标上持续优于对比模型,包括:
在采样效率方面,由于流匹配路径更短且为确定性过程,PropMolFlow 仅需约 100 个时间步,相比扩散模型的 1,000 步实现 ≥8 倍加速,同时保持高结构保真度。
物理一致性验证(DFT 校验)
研究人员对生成分子进行大规模 DFT 计算验证,比较目标性质、模型预测值与物理计算结果的一致性。结果表明:
该过程证明模型不仅在数据分布层面有效,同时在物理化学层面具有可信度。
分布外(OOD)性质生成能力
研究人员构建了 OOD 任务,以训练集中罕见的高分位性质值作为目标进行生成。结果显示:
证明 PropMolFlow 具备一定程度的外推泛化能力。
讨论
PropMolFlow 展示了一种将几何完备建模、流匹配生成与性质引导控制统一于单一框架的分子生成范式。该模型不仅实现了高效采样与结构稳定性,还在物性对齐与物理一致性验证方面建立了系统流程。
研究人员指出,未来改进方向包括:
总体而言,PropMolFlow 为AI 驱动分子设计提供了一个在几何一致性、性质可控性与计算效率之间高度平衡的基础框架,为后续智能分子发现系统奠定了方法学基础。
整理 | DrugOne团队
参考资料
Zeng, C., Jin, J., Ambrose, C. et al. PropMolFlow: property-guided molecule generation with geometry-complete flow matching. Nat Comput Sci (2026).
https://doi.org/10.1038/s43588-025-00946-y
内容为【DrugOne】公众号原创|转载请注明来源