Nat. Comput. Sci. | PropMolFlow: 基于几何完备流匹配的性质引导分子生成框架

MindDance

发布于 2026-01-28 10:26:52

2030

DRUGONE

分子生成模型正在快速推动化学发现与药物设计的发展。近年来，流匹配模型(flow matching)在无条件分子生成任务中已达到领先水平，但在性质引导生成(property-guided generation)方面仍主要由扩散模型占优。

研究人员提出 PropMolFlow，一种基于几何完备 SE(3) 等变流匹配的性质引导分子生成框架。该方法通过整合多种性质嵌入策略，并引入高斯展开机制对标量物性进行结构化编码，实现对分子结构、原子类型、电荷、键级和三维几何的联合生成。在QM9数据集上的系统评估表明，PropMolFlow在性质对齐精度、结构稳定性与化学有效性方面达到与现有最优扩散模型相当甚至更优的性能，同时显著提升采样效率，在更少时间步数下实现更快生成速度。研究人员进一步通过密度泛函理论(DFT)计算对生成分子的性质进行物理验证，并提出分布外(OOD)生成任务，评估模型在稀有性质区域的泛化能力。

深度生成模型为化学发现提供了一种通过统计采样分子结构、降低高昂物理模拟成本的路径。当前主流三维分子生成方法主要依赖等变图神经网络驱动的扩散模型，在几何建模上表现优异。

相比之下，流匹配方法作为新兴范式，在材料、蛋白质和小分子生成任务中展现出更高的采样效率和路径灵活性。然而，在性质引导生成场景下仍存在多重挑战，包括：

离散化学特征（原子类型、电荷、键级）的表达失真；
手性与几何完整性难以统一建模；
性质嵌入方式缺乏系统性设计；
生成结果缺乏物理层面的独立验证；
模型泛化能力主要局限于训练分布内任务。

研究人员认识到，要实现高可信度的性质可控分子设计，需要在几何完备建模、离散变量建模、性质嵌入机制和物理验证体系之间建立统一框架。

方法

PropMolFlow 基于 FlowMol 架构构建，以几何完备 SE(3) 等变流匹配过程为核心，将分子表示为包含原子类型、电荷、键级和三维坐标的全连接图结构。模型通过联合流匹配过程，同时生成所有分子模态信息。

在性质引导方面，研究人员将标量分子性质映射为高维性质嵌入向量，并设计多种嵌入交互方式（拼接、求和、乘法及其组合），实现性质信息与分子节点特征的深度耦合。同时引入非可训练高斯展开层，将连续性质值转化为局部响应分布，从而增强模型对性质变化的表达能力。最终模型在统一框架下实现几何一致、结构稳定、性质可控的分子生成。

结果

模型框架与生成机制概览

PropMolFlow 在统一流匹配框架中联合建模原子类型、电荷、键级与三维几何结构，通过性质嵌入调控分子生成方向，实现结构与物性的协同生成。