Nature子刊重磅：卫星"看见"植被呼吸，让天气预报在第4天迎来黄金拐点

气象学家

发布于 2026-03-26 12:42:04

280

卫星地表信息提升近地表温度预报技巧

Ruiz-Vásquez, M., O, S., Brenning, A. et al. Land surface information from satellites boost near-surface temperature forecast skill. Commun Earth Environ (2026). https://doi.org/10.1038/s43247-026-03298-1

Figure 1. Global performance of 2-m temperature forecasts.

本研究利用长短期记忆网络（LSTM）构建了数值天气预报（NWP）的深度学习替代模型，系统评估了卫星衍生的地表温度（LST）、增强型植被指数（EVI）和日光诱导叶绿素荧光（SIF）对近地表温度预报技巧的增益。研究发现，在全球尺度上，融入这些未被传统NWP模型同化的卫星数据流，可在1-12天预报时效内将温度预报误差降低约7%（相当于0.25°C的精度提升），其中第4天预报时效改进最为显著。通过SHAP（Shapley加性解释）分析，研究揭示卫星预测因子在全球约60%的网格单元中占据主导地位，其中SIF作为植被光合作用的直接代理变量，对地表能量分配和感热/潜热通量调制具有关键作用。该研究不仅为陆-气相互作用在次季节预报中的重要性提供了量化证据，更为未来NWP模型开发中如何有效利用多源卫星观测提供了重要的方法论指导和数据同化策略参考。

一、研究背景与科学问题

1.1 数值天气预报的瓶颈与深度学习的崛起

数值天气预报（NWP）在过去数十年通过物理参数化方案和计算能力的提升，已显著提高了预报精度。然而，传统NWP模型面临两个根本性挑战：一是物理假设和参数化方案往往过度简化复杂的地球系统过程（如陆-气相互作用、植被动态反馈），导致误差随预报时效延长而迅速传播；二是极高的计算成本限制了模型频繁更新和集合预报的规模。

近年来，纯数据驱动的深度学习方法（如GraphCast、Pangu-Weather、FourCastNet）在中短期天气预报中展现出与传统NWP模型竞争甚至超越的潜力。这些方法不依赖显式的物理参数化，而是通过神经网络从海量历史数据中学习复杂的时空依赖关系。特别重要的是，深度学习模型具有灵活整合多源异构数据的能力，为评估未被传统模型充分利用的观测数据（如卫星遥感产品）提供了理想的试验平台。

1.2 被忽视的卫星数据流

尽管卫星地球观测自1990年代以来已全球可用，NWP模型对其利用仍不充分。具体而言：

• 地表温度（LST）：作为地表能量平衡和湍流热通量分配的关键变量，LST与近地表气温密切相关，但由于NWP模型中地表温度的系统性偏差，LST很少被直接同化。
• 植被指数（EVI）：反映植被绿度和结构，通过蒸散发和地表粗糙度影响近地表温度，但传统NWP通常采用固定的季节性循环而非实时动态植被状态。
• 日光诱导叶绿素荧光（SIF）：作为植被光合作用的直接代理，SIF能实时捕捉植被生理状态对地表能量分配的调控，但此前从未被用于天气尺度预报模型。

本研究的核心科学假设是：在中短期预报时效（特别是3-5天），陆面初始状态和植被动态信息能够提供超越大气初始条件的附加可预报性，这一时段正是大气记忆逐渐衰减而陆面记忆开始主导的关键过渡期。

二、研究方法与技术路线

2.1 LSTM深度学习框架

研究采用长短期记忆网络（LSTM）构建全球格点化的温度预报模型。LSTM作为一种特殊的循环神经网络（RNN），通过门控机制有效处理长时间序列中的依赖关系，特别适合捕捉地球系统数据中的短期记忆和长期趋势。具体设置包括：

• 模型架构：每个格点独立训练一个LSTM模型（共约4万个陆地格点），隐藏层30个单元，1个全连接层，丢弃率0.1
• 输入序列：5天回顾期（look-back）的历史数据作为输入
• 预报时效：1-12天逐日预报，每个时效独立训练模型（避免误差随时间积分累积）
• 两种配置：
- • 基准模型（Baseline）：仅使用大气变量（2米气温、入射长短波辐射、比湿、地表气压、总降水、0-10cm土壤湿度、积雪覆盖度）
- • 卫星增强模型（Baseline plus satellite）：在基准模型基础上增加LST、EVI和SIF三个卫星变量

2.2 数据与验证

• 训练数据：2001年1月1日至2014年8月8日（80%）
• 测试数据：2014年8月9日至2017年12月31日（20%）
• 空间分辨率：0.5°×0.5°，日尺度
• 参考数据：NOAA气候预测中心（CPC）基于站点插值的全球格点气温数据（独立于ERA5和IFS）
• 对比基准：ECMWF次季节-季节（S2S）预报系统的集合平均预报（IFS）

2.3 可解释性分析：SHAP值

为理解黑箱模型的物理机制，研究采用SHAP（SHapley Additive exPlanations）特征重要性分析方法。SHAP值基于博弈论中的Shapley值概念，通过计算每个预测变量对模型输出的边际贡献，量化各变量在控制预报温度中的相对重要性，从而识别主导预报技巧的关键物理过程。

三、主要研究发现

3.1 全球预报技巧的系统性提升

研究结果明确显示，融入卫星数据在全球尺度上显著提升了温度预报技巧：

• 误差降低：全球中位数RMSE降低约6-7%，相当于绝对温度误差减少约0.25°C
• 相关系数提升：异常相关系数（ACC）在全球范围内提高，尤其在基准模型表现较差的区域（如欧洲、北美、南美南部、非洲南部和澳大利亚东部）改进最为明显
• 稳健性增强：卫星增强模型的空间变异性（四分位距）显著小于基准模型，表明其性能更加稳定

值得注意的是，虽然IFS在所有预报时效的ACC指标上仍优于LSTM模型（反映了物理模型在捕捉大尺度缓慢演变温度异常方面的优势），但卫星增强模型显著缩小了与IFS的差距，且在中长期预报（5天以上）表现出比IFS更慢的技巧衰减率。

3.2 卫星数据主导全球陆面预报

SHAP分析揭示了一个关键发现：在全球约60%的陆地格点中，卫星变量（SIF、LST或EVI）是温度预报的首要驱动因子，而非传统的大气变量（占比约40%）。这一发现挑战了传统观念——即短期天气预报主要受大气初始条件主导。

具体而言：

• SIF（日光诱导叶绿素荧光）：是最重要的卫星变量，在植被覆盖区占主导地位。作为光合作用的直接度量，SIF捕捉了植被生理状态对蒸散发和地表能量分配的实时调控。
• LST（地表温度）：在干旱和半干旱地区最为重要，直接反映地表辐射平衡和感热通量。
• EVI（增强型植被指数）：重要性相对较低，因其变化较慢，主要反映植被结构而非短期生理活动。

空间分布上，卫星变量在温带和副热带地区占主导，而在热带地区基准大气变量更重要——这主要归因于热带地区频繁云层覆盖导致的卫星数据质量下降，以及热带植被全年相对稳定的光合活动。

3.3 预报时效的"黄金窗口"

研究首次量化了陆面信息在不同预报时效中的贡献，发现第3-5天是卫星数据发挥最大效益的"黄金窗口"：

• 第4天：全球平均改进幅度最大（RMSE降低约7-8%）
• 短期（1-2天）：改进存在但相对较小，因此时大气记忆仍强
• 长期（10-12天）：改进逐渐减弱，但仍有约3-4%的误差降低，表明陆面记忆对次季节预报仍有价值

这一发现具有重要的业务意义：传统上认为陆面主要用于次季节（>2周）预报初始化，但本研究证明在中短期（3-5天）预报中，陆面-植被相互作用同样关键，这为改进NWP模型的数据同化策略提供了新视角。

3.4 气候与植被 regimes 的调制作用

通过结合柯本-盖格气候分类和植被覆盖度数据，研究揭示了卫星数据效益的空间异质性机制：

• 高植被覆盖区：在温带森林区（如欧洲、北美东部），卫星数据改进最大，因传统NWP中2米气温预测多基于草地参数化，而卫星数据提供了森林冠层的真实状态信息。
• 干旱区：在撒哈拉、中亚和澳大利亚内陆，LST是主导变量，因植被蒸散发作用微弱，地表辐射平衡直接控制近地表温度。
• 热带区：改进最小甚至出现性能下降，主要由于云层污染导致卫星数据缺失和质量下降。

四、物理机制与科学解释

4.1 陆-气耦合的能量学基础

卫星数据提升预报技巧的物理基础在于地表能量平衡方程的准确刻画：

其中净辐射()分配为感热()、潜热()和土壤热通量()。传统NWP模型因土壤湿度初始化和植被参数化误差，常错误估计（蒸散发）和（感热）的分配比例，导致温度预报偏差。

• SIF的作用机制：SIF与总初级生产力（GPP）高度相关，而GPP通过气孔导度直接控制蒸散发。在植被生长季，SIF提供植被生理胁迫的实时信号，帮助模型更准确预测蒸散发冷却效应，从而纠正温度高估（如欧洲夏季）。
• LST的作用机制：LST是地表能量平衡的直接观测，在干旱区，LST准确反映了土壤水分亏缺导致的感热通量增加和温度上升，纠正了模型的冷偏差。

4.2 记忆尺度的匹配

为什么第4天是改进峰值？这涉及大气与陆面记忆尺度的匹配：

• 大气可预报性极限约为7-10天（由混沌特性决定）
• 土壤湿度和植被状态的记忆尺度为几天到数周
• 在第3-5天，大气初始条件的信号已部分衰减，而陆面异常（如土壤湿度亏缺、植被胁迫）的累积效应开始显现，此时准确的陆面初始状态（通过卫星数据表征）成为决定温度演变的关键。

4.3 模型误差的补偿机制

对比基准模型与卫星增强模型的偏差（Bias）空间分布，发现卫星数据主要通过以下机制纠正误差：

• 在基准模型高估温度的区域（如欧洲、东南亚、澳大利亚）：卫星植被指数通过约束蒸散发过程，减少地表过热模拟。
• 在基准模型低估温度的区域（如欧亚大陆北部、非洲、阿拉伯半岛）：LST帮助捕捉干地表的辐射加热效应，缓解冷偏差。

五、方法学创新与局限性

5.1 作为NWP开发"探针"的深度学习

本研究的重要方法论贡献在于展示了深度学习模型可作为物理模型开发的快速测试平台。传统上，评估新观测数据对NWP的影响需要进行复杂且计算昂贵的数据同化试验。而LSTM模型通过端到端学习，可快速评估数据流的潜在价值。本研究发现的"第4天峰值效应"为NWP开发者提供了明确的目标：优先改进3-5天预报的陆面初始化。

5.2 格点独立训练的双刃剑效应

研究采用每个格点独立训练LSTM的策略，这带来了：

• 优势：避免空间插值误差，适应局地气候特征，计算可并行化
• 劣势：无法捕捉空间遥相关（如大气环流波列）和水平平流过程，这解释了为何LSTM的ACC始终低于IFS（后者通过动力核心保持空间连续性）

5.3 数据质量的制约

研究坦诚指出，在站点观测稀少的区域（如非洲、中亚），CPC参考数据本身存在插值误差，这可能：

• 低估真实的预报改进（因验证数据本身有偏差）
• 导致热带地区出现"气候态值优于实时卫星数据"的反常现象（因实时数据噪声大，而气候态平滑了误差）

六、未来展望与业务启示

6.1 数据同化策略的革新

研究结果强烈建议NWP中心应优先考虑同化以下卫星产品：

1. SIF数据：目前尚未被任何业务NWP系统同化，但其对植被生理状态的独特表征能力使其成为改进温度预报的潜力股。
2. 高分辨率LST：尽管LST同化存在模型偏差挑战，但研究显示了其在干旱区的显著价值，值得开发先进的偏差校正同化算法。
3. 动态植被状态：替代当前NWP中使用的静态或慢变植被库，采用实时EVI/SIF动态更新植被参数。

6.2 混合预报框架

研究提出未来发展方向：构建物理-数据混合预报系统。具体而言：

• 在短期（1-3天），依赖NWP物理模型保持动力一致性
• 在中期（3-10天），引入深度学习后处理或混合模型，充分利用卫星陆面信息
• 开发考虑空间耦合的深度学习架构（如Graph Neural Networks），弥补当前LSTM缺乏空间关联的缺陷

6.3 极端事件预报的潜力

论文特别指出，卫星数据对热浪和寒潮等极端温度事件的预报尤为重要。这是因为极端事件往往与陆面反馈（如土壤湿度-温度正反馈、植被胁迫加剧热浪）密切相关。未来研究应专门评估卫星数据对极端温度事件预报技巧的改进。

Figure 2. Analysis of spatial patterns of benefits of using satellite data.

Figure 3. Spatial distribution of variables that are identified as the main drivers of Baseline plus satellite temperature forecasts based on SHAP values