研究首先通过K-means时间聚类方法分析了欧亚大陆SAT的年代际变化时空特征,共识别出20类(图1),再利用GRUBA分别对每个聚类进行后处理,用以降低噪声和数据降维。GRUBA模型结合门控循环单元(GRU),批归一化(Batch Normalization)及注意力机制(Attention)(图2)。在2004至2021年的测试时段,GRUBA模型在20个聚类平均的相关系数技巧从多模式集合平均(MME)的-0.23提高到0.83,均方差技巧评分也从-0.37提高到0.68,预测能力显著提升。此外,研究还基于SHAP可解释性分析方法,定量分析了每个初始场成员的权重,并计算了贡献最高的10个初始场成员预测结果的集合平均(GRUBA-10)。与随机10个初始场成员的集合平均(Random-10)以及MME的对比结果表明,GRUBA的显著提升效果可能得益于其内部的注意力机制对有更好表现的初始场成员赋予了更高的权重,这一优势在中高纬区域更为明显(图3)。本研究得到了国家重点研发计划(2023YFF0806500)项目的支持。

图1 去趋势的5年滑动平均的欧亚大陆SAT时间聚类结果及模式表现。基于1968–2001年观测/ERA5数据得到K-means时间聚类结果。C1–C20展示了第1至第20个聚类的区域平均SAT指数的时间序列,其中黑线表示1968–2021年的观测值,蓝线表示1968–2025年的多模式集合平均;橙色、红色和深红色线分别表示GRUBA在训练期(1972–2001)、测试期(2004–2021)和实时预测期(2022–2025)的预测结果。彩色虚线为四个DCPP模式(CESM1-1-CAM5、CMCC-CM2-SR5、MIROC6和NorCPM1)的预测值。阴影部分表示模式离散度。

图2 GRUBA模型的七层结构。GRUBA的输入为80个CMIP6DCPP集合成员累积0-4年的预测结果,包含5个时间步。GRUBA内部由七个层组成。前四层为两个GRU层,每个GRU层包含50个循环单元以从输入中捕获全面信息,每个GRU层后接一个随机丢弃层以防止过拟合。第五层和第六层分别为批归一化层和注意力机制层,前者用于加速拟合,后者用于为不同时间步分配权重以提升模型性能。第七层是包含30个神经元的全连接层,用于学习前一层输出与观测值之间的非线性映射。

图3 GRUBA-10、Random-10和MME在第9至第20聚类上ACC技巧的热力图。GRUBA-10由SHAP方法在GRUBA中量化的特征贡献最强的10个DCPP成员组成。Random-10由随机10个初始场成员组成。图a和b分别对应训练时段(1972–2001)和测试时段(2004–2021)。加粗数字表示相较于MME具有更优的ACC技巧。

文章信息:
Chen, Y., Huang, Y., Qian, D. et al.Deep learning model for enhancing decadal prediction of Eurasian surface air temperature. npj Clim Atmos Sci (2026). https://doi.org/10.1038/s41612-026-01337-4
供稿|新一代气候预测系统研发与业务应用团队
编辑|段虹羽
审稿|姚遥、徐珍
终审|段明铿
END
声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理。