Nat. Mach. Intell. | 融合扩散Transformer的代数语言模型：用于超材料反向设计

DrugAI

发布于 2026-04-28 10:19:42

450

DRUGONE

生成式机器学习模型正在重塑材料设计领域，但将其扩展到三维超材料的反向设计仍面临计算复杂度高和表示能力不足的挑战。为解决这一问题，研究人员提出了一种名为DiffuMeta的生成框架，将扩散Transformer与代数语言表示相结合，将三维几何结构编码为“数学句子”。

该方法通过紧凑统一的表示方式覆盖广泛的结构拓扑，并利用扩散模型生成满足目标力学性能的壳结构。在考虑屈曲、接触等复杂非线性行为的同时，模型能够针对同一目标生成多样解，从而解决反向设计中的一对多映射问题。实验结果表明，该方法不仅能够精确控制多种力学性能，还能够推广至训练分布之外的目标条件。通过对3D打印结构的实验验证，进一步证明了该框架在加速超材料设计中的有效性与实用性。

随着增材制造技术的发展，研究人员能够精确构建具有复杂结构的超材料，从而在多个尺度上调控材料性能。其中，壳结构超材料因其优异的刚度重量比和能量吸收能力受到广泛关注。

传统反向设计方法主要依赖拓扑优化，但该方法需要大量有限元计算，在高维设计空间和非线性目标条件下计算成本极高。近年来，机器学习方法开始应用于材料设计，通过代理模型预测性能或利用生成模型探索设计空间，取得了一定进展。

然而，现有方法仍存在关键局限：一方面，大多数方法仅针对线性性能进行优化，难以处理非线性行为；另一方面，多目标设计仍然极具挑战。此外，三维结构的表示方式（如体素、网格等）通常数据量庞大，限制了模型效率和泛化能力。

针对这些问题，研究人员提出一种新的思路，即通过隐式方程表示结构，并将其转化为“代数语言”，从而实现更高效、更具表达能力的设计空间探索。

方法

研究人员构建了一个统一的反向设计框架，将壳结构表示、语言建模与扩散生成结合起来。

首先，通过隐式函数定义三维壳结构，将复杂几何表示为由三角函数及其组合构成的数学表达式。这些表达式进一步被拆分为一系列离散的“数学token”，包括函数、系数和运算符，从而形成类似自然语言的序列表示。

基于这一表示，研究人员构建了一个包含超过两万种结构的数据库，并通过有限元模拟获取其应力–应变响应和弹性性质。

在生成模型方面，研究人员采用扩散语言模型，将离散token嵌入连续空间，通过逐步去噪过程生成新的结构表达式。模型利用Transformer结构捕捉序列之间的依赖关系，并通过条件控制机制，将目标力学性能嵌入生成过程，从而实现面向性能的反向设计。

这一方法实现了从“数学表达式”到“结构性能”的端到端建模。

图1：代数语言表示与设计空间构建。

结果

研究人员首先构建了一个大规模壳结构设计空间，将隐式方程表示为token序列，并通过有限元模拟获得其力学响应。结果表明，该表示方式能够覆盖丰富的拓扑类型，包括经典最小曲面以及大量未被探索的新结构。

同时，这种“方程即语言”的表示方式显著降低了维度，使模型能够高效学习复杂结构–性能关系。

图2 ：DiffuMeta框架。

生成模型性能与结构多样性

在无条件生成任务中，DiffuMeta能够生成高比例有效结构，且生成结果具有高度新颖性和多样性。相比随机采样，其有效结构比例显著提高，说明模型成功学习了设计空间中的隐含规律。

此外，生成结构在计算成本上极低，实现了快速设计迭代。

单目标反向设计性能

在给定目标应力–应变曲线的条件下，模型能够生成多个结构，这些结构通过不同的几何机制实现相同力学性能。

研究人员发现，即使几何结构非常相似，微小变化也可能导致完全不同的力学响应，这反映了结构–性能关系的高度复杂性。而DiffuMeta能够有效捕捉这一关系，实现高精度匹配。

此外，该方法天然支持“一对多”设计，即为同一目标生成多个候选结构，这在传统优化方法中难以实现。

图3：目标应力–应变匹配。

超出训练分布的泛化能力

在更加复杂的目标条件下（如双峰应力响应或非单调行为），传统方法难以找到合适结构，而DiffuMeta仍能生成高度匹配的设计。

这些结构通过复杂的屈曲、接触等机制实现目标性能，说明模型不仅学习了数据分布，还掌握了潜在物理规律。

图4：未见目标性能预测。

多目标联合设计能力

进一步研究表明，模型能够同时控制多个力学目标，例如应力–应变曲线与泊松比。这对于实际工程应用至关重要。

生成结果显示，不同结构能够在保持相同压缩性能的同时，实现完全不同的横向变形行为，例如负泊松比或正泊松比响应，体现了设计空间的高度灵活性。

图5：多目标设计结果。

实验验证

研究人员通过3D打印生成的结构进行实验验证，结果显示实验应力–应变曲线与模拟结果高度一致。

不同结构成功复现了平台响应、屈曲软化及接触硬化等复杂非线性行为，证明了该方法在实际制造中的可行性。

图6：3D打印与实验结果。

讨论

该研究提出了一种全新的材料设计范式，通过将几何结构表示为代数语言，并结合扩散Transformer实现反向设计，显著拓展了设计空间的表达能力。

该方法的核心优势在于：一是通过紧凑表示降低计算复杂度；二是利用生成模型自然处理一对多问题；三是具备良好的泛化能力，能够预测未见性能目标。

同时，该方法也存在一定局限，例如目标性能需在物理可实现范围内，以及当前模型未显式引入物理约束。未来可以通过引入物理信息或主动学习策略进一步提升性能。

总体来看，该框架为超材料设计提供了一种高效、可扩展的解决方案，并有望扩展至多物理场问题及更复杂材料系统，甚至与大语言模型结合，实现基于自然语言的材料设计。

整理 | DrugOne团队

参考资料

Zheng, L., Kumar, S. & Kochmann, D.M. Algebraic language models for inverse design of metamaterials via diffusion transformers. Nat Mach Intell (2026).

https://doi.org/10.1038/s42256-026-01218-8

内容为【DrugOne】公众号原创｜转载请注明来源

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-04-24，如有侵权请联系 cloudcommunity@tencent.com 删除

模型