基于AI天气预报的沙尘暴人工智能预报模型——AI-DUST

气象学家

发布于 2026-03-26 10:49:49

490

文章被收录于专栏：气象学家气象学家

基于AI天气预报的沙尘暴人工智能预报模型——AI-DUST

https://doi.org/10.1038/s44407-025-00048-z

研究背景与科学意义

沙尘暴（Sand and Dust Storms, SDS）作为干旱和半干旱地区频发的灾害性天气现象，对全球气候变化、大气环境质量、人类健康以及社会经济活动均产生深远影响。东亚地区是全球受沙尘天气影响最为严重的区域之一，2021年与2023年春季发生的超强沙尘事件对华北地区造成了严重的环境灾难与经济损失，突显了准确预报沙尘天气的紧迫性与重要性。

传统数值沙尘预报模式（如CMA-CUACE、KMA-ADAM3）通过显式求解大气动力学方程组，刻画沙尘的起沙（emission）、输送（transport）、扩散（diffusion）与沉降（deposition）等关键物理过程，已成为当前业务预报的主流工具。然而，这类模式依赖于传统数值天气预报（NWP）系统提供气象驱动场，不仅计算成本高昂，且在长期预报中受限于初值误差和模式物理参数化方案的不确定性，预报时效与精度常面临瓶颈。

近年来，人工智能技术在天气预报领域取得革命性突破，以GraphCast、AIFS（Artificial Intelligence Forecast System）为代表的AI气象预报模型展现出超越传统NWP模式的计算效率与预报技巧。在此背景下，机器学习技术在沙尘预报中的应用也日益广泛，但现有方法多局限于对数值模式结果的统计后订正（bias correction），或利用卫星遥感数据进行短时效（<24小时）反演预报，难以兼顾长时效与高效率。部分端到端AI框架（如Aurora）虽具备全球气溶胶预报能力，但面临训练样本不平衡、极端事件样本稀缺及计算资源需求巨大等挑战。当前领域存在一个关键空白：尚未建立能够直接利用AI气象预报产品作为驱动场、且具备物理可解释性的沙尘预报系统。

本研究提出的AI-DUST模型正是填补这一空白的开创性工作。该模型通过深度学习架构显式学习沙尘输送、扩散与沉降的物理规律，直接对接ECMWF的AI天气预报系统（AIFS），无需依赖传统NWP链式计算，实现了从气象场到沙尘浓度的高精度端到端映射。研究意义在于：首次验证了AI气象预报可直接驱动大气环境模式的可行性，为构建"AI气象预报-AI化学传输"全链条智能预报体系奠定了技术基础，对提升沙尘灾害早期预警能力、降低计算成本具有重要实践价值。

研究方法论与模型架构

总体设计范式：替代而非订正

AI-DUST的核心创新在于采用"物理替代"（physics emulator）范式，而非传统的"模式订正"（bias correction）思路。模型通过学习传统数值模式（WRF-CAMx）中输送、扩散和干沉降模块的输入-输出关系，完全替代了数值求解平流-扩散方程的计算过程。这种设计使得模型可直接由AIFS等AI气象预报产品驱动，绕开了传统NWP的计算瓶颈，同时保留了物理过程的可追溯性。

图神经网络架构与特征融合机制

模型基于图注意力网络（Graph Attention Network, GAT）构建空间关系学习模块。将研究区域离散为15×15的网格图（grid graph），每个节点代表一个格点，与其四邻域（four-connected neighbors）建立空间连接。采用三层堆叠GAT架构（GATConv），通过可学习的注意力权重聚合邻域信息：

第一层执行标准图卷积，提取基础空间特征；从第二层起引入显式特征融合机制，将平流场（advection）、起沙通量（emission flux）和初始浓度场等关键物理变量通过独立线性投影后，与图卷积输出拼接（concatenate），形成增强节点嵌入（enriched node embeddings）。这种分层融合策略确保模型在不同深度都能感知到驱动沙尘变化的关键强迫因子。

物理约束嵌入与损失函数设计

为保证预测结果的物理一致性，研究在架构和优化目标两个层面施加了严格约束：

架构层面约束：模型不直接预测绝对浓度值，而是通过Sigmoid函数输出一个介于0-1的缩放因子f，再乘以基于物理的参考浓度（物理先验项），最终预测值为：

其中为当前时刻浓度，为平流项（质量输送），为起沙贡献（为起沙通量，为混合层高度，取3000m）。这种设计确保预测值非负、有界，且与物理参考态保持合理偏离。

损失函数约束：采用复合损失函数，包含数据 fidelity项和物理 consistency项：

其中为自适应权重（当预测偏离物理参考值超过10倍时增大至10），强制模型学习符合质量守恒定律的浓度演变规律。

基于物理的起沙方案与地表特征

模型保留并嵌入了基于Shao (2004)参数化方案的起沙计算模块，利用AIFS提供的土壤湿度、摩擦速度（friction velocity）及高分辨率地表粗糙度（surface roughness density）数据，计算格点起沙通量。研究特别强调高分辨率地表特征（如1km尺度粗糙度）的重要性——敏感性试验表明，使用高精度地表数据可使威胁评分（Threat Score, TS）平均提升18%，证实了AI模型对物理下垫面强迫的合理响应。

分区训练策略：解耦不同动力学过程

鉴于起沙区（emission-active regions）与非起沙区（non-emission regions）的沙尘浓度演变受控于截然不同的物理机制（前者受局地源汇与动力抬升主导，后者受平流输送与沉降主导），研究采用分区训练策略：分别针对两类区域独立训练两个模型，推理时根据格点是否位于沙源地自动切换模型。这种解耦策略避免了不同动力学 regime 间的相互干扰，显著提升了模型在起沙区的预报精度。

研究数据与实验设计

训练数据集的生成与构建

为生成具有物理一致性的训练样本，研究团队利用WRF（Weather Research and Forecasting）模式与CAMx（Comprehensive Air Quality Model with Extensions）对2020-2024年东亚沙尘事件进行了五年期的离线模拟。模拟区域覆盖70°E–140°E、10°N–55°N，水平分辨率0.25°，包含主要沙源地（塔克拉玛干、戈壁、蒙古高原）及下游沉降区。

从模拟结果中提取多层级气象场（地表、1000、950、850、700、500 hPa的风场、温度场）及沙尘浓度场，构建15×15格点样本（以目标格点为中心，向四周各延伸7格），总样本池超过2亿个实例。针对边界格点采用零值填充（zero-padding）处理。

数据预处理与标准化

考虑到纬向-经向投影下格点面积随纬度变化的特点，研究对风场分量进行了网格间距归一化处理：，，其中、分别为纬向和经向格距。这一处理消除了纬度差异导致的平流强度尺度依赖。

为去除地形绝对高度的位置偏差，采用相对高程表示法：以中心格点为参考（高程设为0），周边格点高程相对于中心点计算。气象变量（风速、温度等）和相对高程进行Z-score标准化（零均值、单位方差）；沙尘浓度与起沙通量因具有高动态范围和偏态分布特征，采用自然对数变换（ln）以稳定方差、改善模型学习效率。

分层随机抽样策略

考虑到起沙事件的稀缺性与大气状态的多样性，研究设计了精细的分层抽样方案：（1）平衡起沙区与非起沙区样本数量，避免类别不平衡；（2）确保高地形差异样本（中心与周边格点相对高差>500m）占比不低于20%，保证模型对复杂地形的泛化能力；（3）按浓度变化率（）分层：起沙区分为<500、500–1000、1000–3000、>3000 μg/m³四档，非起沙区分为<100、100–500、500–1000、>1000 μg/m³四档，确保训练集覆盖从清洁到极端污染的全物理 regime。

最终训练集使用2020–2023年数据，2024年数据独立保留用于模型泛化能力测试。

实时预报验证设置

自2025年3月1日起，AI-DUST进入业务化实时预报阶段，使用ECMWF的AIFS（水平分辨率0.25°）气象预报产品作为驱动场，提供未来10天的逐3小时沙尘浓度预报。验证数据包括：（1）中国气象局（CMA）提供的沙尘天气现象观测记录；（2）中国环境监测总站（CNEMC）的地面PM10浓度观测；（3）SNPP-VIIRS卫星的Deep Blue气溶胶光学厚度（AOT）产品。

对比基准选取WMO SDS-WAS北京区域中心的两套业务数值模式：韩国气象厅的ADAM3（Asian Dust Aerosol Model 3）和中国气象局的CUACE。重点关注2025年春季14次大范围沙尘事件的预报表现，特别是4月10–14日这一近十年来首次影响到华南地区的极端沙尘事件。

主要研究结果

单步模拟：对数值模式的高精度复现

在与传统数值模式的单步对比中，AI-DUST展现出卓越的模拟精度：起沙区与非起沙区的Pearson相关系数（R）均超过0.99（非起沙区达0.9994，RMSE仅0.0444；起沙区达0.997，RMSE 0.068）。非起沙区表现略优于起沙区，主要因为起沙过程涉及复杂的垂直夹卷（vertical lofting）不确定性；低层（地表、950 hPa）预报精度高于高层（500 hPa），反映了边界层内沙尘浓度信号更强、训练样本更丰富。

多步预报：长时效预报能力的突破

在长达80个时间步（对应10天）的连续预报试验中，AI-DUST表现出优异的误差控制能力。虽然随预报时效延长性能逐渐衰减，但至第80步时，起沙区R仍维持在0.71（RE=-5.9%），非起沙区R为0.63（RE=-8.3%）。值得注意的是，起沙区因持续的起沙过程作为"误差重置"机制（error reset），长期预报稳定性反而优于非起沙区（后者误差随输送过程累积）。这一物理行为与真实大气过程一致，证明模型学习到了合理的动力学特性。

实时预报：对业务模式的全面超越

在2025年春季14次沙尘事件的实时预报中，AI-DUST的1天预报TS达0.33，2–3天维持在0.28，至第10天仍保持在0.22以上。这一表现显著优于WMO SDS-WAS区域中心传统数值模式 typical 的0.20–0.29（1–3天）水平，意味着AI-DUST的10天预报技巧已可媲美部分业务模式的3天预报。

与KMA-ADAM3模式的直接对比显示，在24–48小时预报窗口内，AI-DUST的平均TS为0.42，较KMA（0.33）提升27%。在14次事件中，AI-DUST在9次事件中表现优于KMA，特别是在强沙尘事件（TS>0.5）的捕捉上展现出更高的命中率和空间准确率。

极端事件预报：罕见南侵沙尘的成功预测

2025年4月10–14日沙尘事件是近十年来首次影响华南地区（包括广东、广西）的极端个例，训练集中缺乏类似样本。AI-DUST成功预测了此次事件的空间范围和强度：华南地区PM10浓度相对误差控制在±20%以内，区域平均TS达0.75，超过一半监测站点的时序相关系数R>0.8。这一结果强有力地证明了模型的泛化能力（generalization capability）——它学习到了沙尘输送的物理本质，而非仅仅记忆历史统计特征。

跨区域泛化：零样本迁移至撒哈拉

为验证模型的地理可移植性，研究进行了北非和阿拉伯半岛的零样本（zero-shot）预报试验。在未使用撒哈拉任何训练数据的情况下，AI-DUST成功再现了2025年3月22日撒哈拉中部向北输送的沙尘带结构，以及5月12日阿拉伯半岛东北部的强起沙事件。尽管对撒哈拉特定区域（30°E附近）存在轻微高估，但整体空间形态与VIIRS卫星观测高度一致，表明模型已学习到跨区域的、位置不变的（location-invariant）物理规律。

研究局限性与不确定性分析

起沙与垂直夹卷过程的不确定性

在起沙活跃区，特别是500 hPa高层，模型误差相对较大（R=0.993，RMSE=0.107）。这反映了AI模型在刻画起沙后沙尘垂直夹卷进入自由大气的微物理过程时仍存在局限，该过程涉及湍流边界层与稳定层的复杂相互作用，当前物理参数化方案可能过于简化。

长距离输送中的系统性偏差

在下游沉降区（如华东、华中），模型对PM10浓度存在0–50%的系统性低估。这可能源于干沉降速度参数化在远距离输送过程中的累积误差，或对大尺度天气系统（如蒙古气旋）输送路径的细微偏差敏感性不足。此外，AI气象预报场（AIFS）自身的系统性偏差也会通过误差传递影响沙尘预报。

跨区域应用的物理参数适用性

尽管在撒哈拉地区的零样本试验总体成功，但在局部区域（如30°E附近）观察到沙尘浓度高估。这可能与不同区域土壤颗粒大小分布、矿物组成等地表特征差异有关，Shao方案中的关键参数（如阈值摩擦速度u*t）可能需要针对新区域进行本地化调整，而非直接迁移。

模型架构的固有局限

15×15的局部图结构虽然计算高效，但可能在物理上截断了远距离平流（long-range advection）的影响，对于超强沙尘暴中跨越数千公里的快速输送过程，局部邻域信息可能不足以完全表征上游源区的影响。此外，图注意力机制对强非线性化学过程（如沙尘作为云凝结核的非均相化学反应）的表征能力尚未验证。

讨论与科学价值

物理信息深度学习的新范式

AI-DUST的成功实践验证了"物理信息神经网络"（Physics-Informed Neural Networks, PINNs）在大气科学中的巨大潜力。通过在损失函数中嵌入平流-扩散方程的质量守恒约束，模型不仅拟合了数据，更学习到了符合物理定律的相空间轨迹。这种"物理+数据"双驱动范式，相比纯数据驱动的黑箱模型，具有更强的外推能力和可解释性。

AI气象预报下游应用的范式革新

本研究最重要的方法论贡献在于证明了AI气象预报产品（如AIFS）可直接用于驱动大气化学模式，无需经过传统NWP的中转。这种"端到端AI"架构消除了数值模式计算瓶颈，使得利用最新AI气象预报成果进行环境预报成为可能。敏感性试验表明，使用AIFS驱动的预报技巧显著优于使用NCEP-GFS或CMA-GFS驱动的结果，凸显了高质量AI气象驱动场的重要性。

沙尘预报时效的重大突破

传统数值模式由于误差快速增长，沙尘预报的有效时效通常局限于3–5天。AI-DUST将有效预报时效延长至10天（TS>0.22），这对次季节尺度（sub-seasonal）沙尘活动预测具有里程碑意义，可为农业规划、航空安全、公共卫生防护提供更长的决策窗口。

模型可解释性与物理一致性验证

模型对不同气象驱动场（AIFS vs. GFS vs. CMA-GFS）表现出的敏感性差异，以及使用高分辨率地表数据后的性能提升，均证明AI-DUST并非简单的统计拟合工具，而是建立了从气象强迫到沙尘响应的合理物理映射。这种可解释性是AI模型业务化应用的重要前提。

未来研究方向与展望

全球大气化学AI模式的构建

基于AI-DUST的成功经验，下一步应构建覆盖全球、包含多物种（硫酸盐、硝酸盐、黑碳、有机碳等）的AI驱动大气化学模式。通过整合更多化学过程的物理约束，发展适用于全球不同气候区的通用化学传输AI代理模型。

混合预报系统的多尺度耦合

探索AI全球预报与区域高分辨率模式（如WRF-Chem、CMAQ）的混合应用方案：利用AI-DUST进行快速全球预报，再通过动力降尺度（dynamical downscaling）或AI超分辨率（super-resolution）技术生成区域高分辨率产品，兼顾效率与精度。

物理约束的深化与拓展

引入更复杂的干湿沉降参数化（考虑粒子尺度分布、湿度影响）、非均相化学过程（沙尘与污染气体的相互作用）以及辐射反馈过程，提升模型对复杂大气化学-气象耦合过程的表征能力。

数据同化与实时更新机制

发展适用于深度学习模式的观测数据同化方法，结合卫星AOD、激光雷达（lidar）廓线和地面PM10观测，实现AI-DUST的实时滚动更新（rolling update）与误差自校正，进一步提升极端事件的捕捉能力。

开放科学社区与业务化部署

研究团队已开源AI-DUST代码及预训练参数，未来应建立开放的全球沙尘AI预报社区，汇集多区域观测数据与模型改进，推动AI沙尘预报从研究原型向业务化系统的全面转型。

以上是对文章的详细解读，如有不当之处欢迎批评指出！

END

声明：欢迎转载、转发。气象学家公众号转载信息旨在传播交流，其内容由作者负责，不代表本号观点。文中部分图片来源于网络，如涉及内容、版权和其他问题，请联系小编处理。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-02-18，如有侵权请联系 cloudcommunity@tencent.com 删除

事件

本文分享自气象学家微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度