
https://doi.org/10.1016/j.xcrp.2025.102996

当前全球能源格局正经历百年未有之大变革。国际能源署数据显示,2023年全球新增并网光伏装机容量达到447吉瓦,占新增发电总容量的78%,较2010年增长逾40倍。根据碳中和目标倒逼路径,预计到本世纪中叶,太阳能将成为全球主导电源。然而,光伏发电固有的间歇性、波动性与不确定性,给现代电力系统的安全经济运行带来了前所未有的挑战。云系的生消演变、移动变形与消散过程直接导致地表太阳辐照度的剧烈波动,这种波动若不能准确预报,将引发供需失衡、频率失稳乃至大面积停电等系统性风险。
从电力市场运营角度看,约80%的电力交易在日前市场完成,这要求预报系统必须提供可靠的24小时太阳辐照度预报。当前,1吉瓦时预报误差的经济代价已达3-5欧元/兆瓦时,这一成本在高比例可再生能源渗透场景下呈指数级增长。因此,发展精准、高效、可靠的中期太阳辐照度预报技术,已成为保障新型电力系统安全、提升新能源消纳能力、降低系统运行成本的关键科学问题与技术瓶颈。

数值天气预报(NWP)作为当前业务预报的黄金标准,其核心流程包括数据同化与偏微分方程(PDE)求解两大计算密集型环节。数据同化通过变分法或集合卡尔曼滤波,将卫星、雷达、探空、地面站等稀疏观测转换为模式格点上的初值场;随后通过迭代求解大气运动方程组、热力学方程、水汽方程及辐射传输方程,得到未来时刻的预报场。这一过程需在超级计算机集群上运行1至数小时,计算成本极高。以美国高分辨率快速刷新模式(HRRR)为例,其3公里分辨率、每小时更新的预报系统虽代表当前NWP最高水平,但仍受制于计算效率与预报时效的固有矛盾。
更关键的是,NWP模式对云微物理、辐射-云相互作用、边界层湍流等次网格过程的参数化方案存在系统性偏差,导致云量与辐照度预报精度难以满足光伏电站精细化调度需求。尤其是在复杂地形、海岸锋区、强对流天气等云系变化剧烈区域,模式预报能力显著下降。这种"慢且不够准"的困境,严重制约了太阳能在电力市场中的竞争力。
近年来,深度学习技术在天气预报领域异军突起。Pangu-Weather、GraphCast、Fengwu、Fuxi等大模型在全球范围的中短期预报中展现出超越欧洲中期天气预报中心(ECMWF)IFS模式的潜力。然而,这些模型无一例外地依赖NWP数据同化系统提供的格点初值场,未能摆脱计算负担,且未直接输出太阳辐照度或云量预报。MetNet-2虽实现了雷达与卫星数据的直接驱动,但仅针对降水预报,未触及辐射预报核心问题。
现有太阳辐照度AI预报模型多局限于单站或局地点预报,预报时效通常不超过4小时,无法支持日前市场决策。这类模型多采用CNN-LSTM、Transformer等架构处理全天空成像仪或地面观测数据,但缺乏大尺度空间上下文信息,对天气系统演变的前兆信号捕捉能力弱。因此,构建端到端的、基于卫星观测的、覆盖区域尺度的24小时太阳辐照度预报AI大模型,成为填补技术空白、推动能源气象学发展的关键突破口。

SolarSeer的核心创新在于建立了从卫星观测到太阳辐照度预报的直接映射关系,彻底摒弃了传统NWP的数据同化与PDE求解环节。这一范式转换的物理基础在于:地球静止轨道卫星(GOES)的连续观测已以1公里空间分辨率、15分钟时间分辨率捕获了大气云系演变的完整信息,AI模型可通过自注意力机制学习云系生消演变的时空动力学特征,无需显式求解大气运动方程。
模型采用双模块串联架构:云量预报模块与辐照度转换模块。前者基于6小时历史卫星图像序列,预报未来24小时总云量(TCC);后者将云量预报结果与晴空太阳辐照度理论值融合,生成最终的地表太阳短波辐射(SSRD)预报。这种设计既保证了物理可解释性——云量是调控地表辐射的核心因子,又通过晴空辐射先验知识注入,约束了模型在碧空条件下的预报合理性。
云量预报模块采用4层自适应傅里叶神经算子(AFNO)Transformer结构。AFNO架构的核心优势在于其频谱域注意力机制:通过快速傅里叶变换(FFT)将时空特征映射到频域,在傅里叶空间执行全局自注意力计算,再通过逆FFT返回物理空间。这种设计天然适合处理平流-扩散类偏微分方程,能够有效捕捉云系平流、波动传播等大尺度动力学过程。
具体实现中,输入的卫星图像序列通过4×4像素块嵌入(Patch Embedding)映射到600维特征空间,经4层AFNO层处理后,采用双曲正切激活函数输出0-100%的云量预报。该激活函数的选择至关重要,它不仅保证了物理边界约束,还避免了ReLU函数在饱和区导致的梯度消失问题,使模型能稳定学习薄云、碎云等边缘状态。
辐照度模块采用8层Swin Transformer(移位窗口Transformer)结构,这是一种层次化视觉Transformer,通过局部窗口自注意力与跨窗口移位机制,在降低计算复杂度的同时保持全局建模能力。模块输入包括:云量预报模块输出的24小时云量场,以及由Ineichen-Perez晴空模型计算的同期晴空太阳辐照度。
晴空辐射先验的引入是本研究的另一亮点。Ineichen-Perez模型基于纬度、经度、时间、海拔等参数,计算无云条件下的理论最大辐照度,其不确定性主要源于气溶胶光学厚度(AOD)的估算。该先验知识为模型提供了太阳几何轨道约束,使AI模型只需学习"云衰减效应"这一相对不确定分量,大幅降低了学习难度。云量与晴空辐射的融合通过残差连接实现,允许模型在晴空辐射基础上叠加云遮挡修正,符合辐射传输的物理叠加原理。
模型训练采用分阶段迁移学习策略。首先独立训练云量模块,以RTMA再分析资料为真值,使用Adam优化器(学习率0.0002),批大小128,最大500轮,早停策略为50轮验证损失不下降。随后固定云量模块权重,训练辐照度模块,以ERA5再分析资料为真值,学习率0.002,每10轮衰减0.95倍,批大小16,最大1000轮。最终将两模块权重融合,形成统一推理图。
训练数据覆盖2017年5月13日至2022年12月31日,空间范围覆盖美国本土(26°N-49.95°N, 68.55°W-126°W),分辨率0.05°(约5公里)。测试集为2023年全年数据,完全独立于训练期与验证期(2022年每月4-6日),确保评价的客观性。整个训练过程在微软Azure AI平台上使用16块AMD MI200 GPU(总显存1TB),耗时约1周,体现了大模型训练的工程化能力。

研究采用GOES-16/17地球静止环境观测卫星的先进基线成像仪(ABI)Level-1b数据,选取2、7、10、14四个波段。波段2(0.64 μm)为可见光通道,捕获云反射太阳辐射,对云光学厚度敏感;波段7(3.9 μm)为近红外短波窗区,昼夜均可探测雾与低云;波段10(7.3 μm)位于水汽吸收带,用于构建云掩膜;波段14(11.2 μm)为长波红外窗区,探测云顶温度与气溶胶。四通道组合既覆盖可见光-近红外-热红外谱段,又兼顾云宏微观物理特性反演需求,为AI模型提供了多视角观测约束。
数据预处理包括:15分钟原始观测重采样为1小时间隔,双线性插值至0.05°统一网格,质量控制剔除异常值与缺失值。训练期间共处理超过5年、约43,800小时的连续观测序列,数据量达数十TB,体现了大数据驱动的模型构建理念。
云量真值采用美国国家海洋大气管理局(NOAA)的实时中尺度分析(RTMA)资料,其空间分辨率2.5公里,每小时更新,通过融合地面、雷达、卫星观测生成。RTMA云量场虽为分析产品而非纯观测,但在美国本土具有较高可信度,其2.5公里分辨率经插值后可为5公里AI模型提供足够的空间细节。
太阳辐照度真值采用欧洲中期天气预报中心ERA5再分析资料,其"向下太阳短波辐射"变量空间分辨率0.25°,时间分辨率1小时。ERA5通过四维变分同化系统整合卫星辐射观测与模式物理约束,在全球范围具有良好一致性。尽管其空间分辨率较粗,但小时尺度的昼夜循环、季节变化与云-辐射耦合特征均被良好保留,适合作为大区域AI模型的训练目标。
为避免再分析资料可能存在的系统性偏差,研究引入Synoptic Data公司提供的1,800个地面气象站观测作为独立验证。这些站点均匀分布于美国本土,涵盖沙漠、高原、平原、海岸等多种气候区,提供分钟级总辐射观测。关键验证策略是:模型训练完全未使用任何地面站数据,因此站网验证可真实反映模型在"真实世界"的泛化能力。
验证指标包括均方根误差(RMSE)、平均绝对误差(MAE),并创新性地引入一阶差分(Diff)误差评估,即预报辐照度时间序列的波动幅度误差。该指标对电力系统灵活资源配置至关重要,因电网调度更关注辐照度"变化率"而非绝对值。

在所有24个预报时效(1-24小时)和所有初始时刻(UTC 00:00-23:00),SolarSeer的云量预报RMSE较HRRR-NWP降低15.2%-36.0%,MAE降低14.8%-35.2%。首小时改进最小(约15%),2小时后改进稳定在25%以上。空间分布上,99.99%区域的RMSE显著降低,西海岸部分地区改进超过30%(图3C)。这表明AI模型对海洋性层积云、地形云等复杂云系的生消演变捕捉能力远超传统模式。
典型个例分析(2023年1月20日UTC 06:00起报)显示,HRRR-NWP倾向于预报0%或100%的二值化云量,而地面真值多为中间状态(如53%),SolarSeer能有效预报此类半透明云场景。此外,HRRR-NWP对小块晴空区(图S3A红圈)存在明显漏报,SolarSeer则准确捕捉,这得益于卫星观测对云隙的直接敏感性。
在ERA5再分析资料验证中,SolarSeer的24小时辐照度预报RMSE较HRRR-NWP降低27.28%,MAE降低36.08%。全区域99.87%格点RMSE降低,西部与南部地区改进达40%(图3D)。对比基准中,HRRR-NWP与晴空模型均显著优于理论晴空值,证明两者都具备云衰减修正能力,但AI模型的修正精度更高。
地面站验证结果更具说服力:在1,800个站中,1,778个站(98.78%)SolarSeer的RMSE低于HRRR-NWP,中位数MAE与RMSE均创最低纪录。24小时预报平均RMSE降低15.35%,MAE降低16.86%。值得注意的是,HRRR-NWP在地面站验证中仅略优于晴空模型,而在再分析资料验证中优势显著,这揭示了ERA5与实际观测在辐照度反演算法、气溶胶参数化等方面的系统性差异。SolarSeer在两种真值体系下均表现最优,证明其鲁棒性与适应性。
对电力系统最为关键的辐照度一阶差分预报(即波动幅度),SolarSeer实现质的飞跃:再分析资料中,RMSE降低50.12%,MAE降低48.99%;地面站中,RMSE降低16.90%,MAE降低20.50%。100%区域、100%站点的辐照度波动RMSE均优于HRRR-NWP,这是前所未有的突破。波动预报的改进在云量预报中亦有体现,云量差分RMSE降低28.93%,MAE降低28.84%。
波动预报精度的提升,意味着AI模型不仅能预报"有多少光",更能准确预报"光如何变"。这对日内滚动调度、储能充放电策略、旋转备用容量配置等电网运行决策具有直接经济价值。例如,在League City站2023年11月的预报中,SolarSeer对辐照度快速升降过程的相位与幅度捕捉远胜HRRR-NWP,而后者对多云天气的平滑处理导致波动信号严重失真。
SolarSeer在美国本土5公里分辨率、24小时预报的完整推理过程,在单块AMD MI-200 GPU上耗时不足3秒,而HRRR-NWP在超级计算机集群上需1-3小时,速度提升超过1,500倍。这种效率跃迁源于AI模型的前向传播特性:一旦训练完成,推理过程仅为矩阵运算,无需迭代求解PDE,也无需执行复杂的数据同化。这一优势使SolarSeer具备实时更新、高频滚动的潜力,可支持分钟级预报产品生成,而NWP的"预报滞后"问题(如12:00起报的预报需14:00方能获得)则迎刃而解。

研究证实,地表太阳辐照度的不确定性分量(实际值减去晴空理论值)与总云量存在显著正相关,全美85.15%区域相关系数大于0.5。SolarSeer通过云量模块优先学习云动力学,再耦合晴空辐射先验,符合辐射传输的"晴空背景+云衰减"物理框架。这种分步学习策略降低了模型自由度,避免了端到端黑箱模型因物理约束不足导致的过拟合风险。
西部地区辐照度预报改进尤为显著(约40%),这与该地区气溶胶光学厚度(AOD)高值区高度吻合。传统NWP采用气候态气溶胶廓线,对野火、沙尘暴等瞬态事件刻画不足,导致晴空辐射系统性高估。SolarSeer输入的GOES波段14(11.2 μm)对气溶胶敏感,AI模型通过历史数据学习,隐式建立了AOD-辐照度衰减关系,无需显式反演AOD即可修正气溶胶偏差。这种"数据驱动+物理引导"的混合建模思路,是AI气象学的重要发展方向。
AI模型对西海岸、佛罗里达半岛等云系复杂区域的改进,归因于Transformer架构的长程依赖建模能力。AFNO的频域注意力可捕捉天气系统千公里尺度的传播特征,Swin Transformer的窗口移位机制则兼顾了局地云团的精细结构。相比之下,NWP的有限差分格式在陡峭地形区易产生数值耗散与相位误差,对中小尺度对流组织化过程模拟能力有限。
尽管SolarSeer表现卓越,但仍存在若干局限:
训练数据依赖:模型完全依赖ERA5与RTMA再分析资料作为真值,这些资料本身包含模式偏差。若再分析资料在云辐射过程参数化中存在系统性误差(如云光学厚度、云水路径反演偏差),AI模型会"学习"并复现这些偏差。未来需探索同化地面高质量辐射观测,进行在线偏差订正。
预报时效:当前仅支持24小时确定性预报,未考虑超过24小时的云系发展记忆效应。对于慢变天气系统(如阻塞高压、季风云团),延长预报时效至48-72小时是技术必然,但需引入更长的历史记忆窗口(如24-48小时)。
空间覆盖:目前限于美国本土。向全球扩展面临GEO卫星观测不一致(如东亚使用Himawari、欧洲使用MSG)、模式分辨率调整、区域气候特征差异等挑战。需针对不同气候区(热带对流、副热带高压、极地层云)进行模型微调或增加气候带判别器。
不确定性量化:仅提供单值确定性预报,未给出概率分布或置信区间。电力系统调度需基于风险决策,单一预报难以支撑鲁棒优化。当前简单的输入扰动集合方法无法保证预报集合的统计一致性。
极端天气鲁棒性:对飑线、中气旋、锋面云带等强天气过程的预报能力未充分评估。极端天气下云系光学特性剧变,若训练样本不足,模型可能失效。
SolarSeer的成功并非否定物理模式的价值,而是揭示了观测驱动与方程驱动两种范式的互补性。NWP的优势在于外推能力、物理守恒性、可解释性强;AI的优势在于模式非线性逼近、计算高效、对观测敏感。未来混合架构(如AI修正NWP偏差、AI加速辐射传输计算、AI参数化次网格过程)将是主流方向。
扩散模型集成:引入去噪扩散概率模型(DDPM)实现基于生成式AI的集合预报。DDPM通过逆向扩散过程生成多成员预报,其概率框架天然适合不确定性量化,可生成符合物理约束的预报集合,提升极端天气风险预警能力。
实时数据流同化:当前模型推理完全依赖历史6小时卫星观测,未纳入最新观测进行滚动更新。未来可设计轻量级数据同化模块,将最新GOES观测作为边界条件注入,实现"预报-观测-修正"闭环,进一步提升短时临近预报精度。
物理约束神经网络:在损失函数中增加质量守恒、能量守恒硬约束,或通过PINN(物理信息神经网络)将辐射传输方程残差作为正则项,防止AI预报出现违背基本物理规律的伪解。
多任务学习扩展:同步预报直接辐射、散射辐射、紫外辐射、光伏功率等衍生变量,利用任务间相关性提升主任务精度,并扩展服务价值链。
SolarSeer的商业化部署将重塑电力市场运营模式。对电网调度中心,秒级更新的辐照度预报可支撑自动发电控制(AGC)与储能实时调度;对光伏电站运营商,高精度日前预报可降低偏差考核费用、提升市场竞价能力;对电力交易中心,区域聚合预报可优化日前市场出清,减少弃光率。据估算,全美太阳能发电因预报精度提升带来的年经济效益可达数十亿美元。
在更广尺度,该技术的全球化推广将加速发展中国家可再生能源接入。对于缺乏高性能计算资源的欠发达地区,基于单GPU的AI预报系统可快速部署,绕过超级计算机建设门槛,实现"弯道超车"。
SolarSeer作为首个在24小时尺度全面超越NWP的太阳辐照度AI预报系统,其科学价值不仅在于精度与效率的量变,更在于预报范式的质变。它证明:在大气观测日益稠密、AI算力持续增强的今天,直接学习观测-预报映射是可行且优越的路径。该系统通过AFNO与Swin Transformer的架构创新、晴空辐射先验的物理融合、五年大数据的充分训练,实现了对美国本土云-辐射系统的精准模拟,速度提升三个数量级,误差降低27%,波动预报误差降低50%,为能源气象学树立了新标杆。
然而,这并非NWP的终结,而是数据驱动与物理驱动融合时代的开端。未来,AI不会替代物理模式,但不懂AI的气象学家将被时代淘汰。如何将AI的"感性认知"与物理模式的"理性推演"有机结合,构建可解释、可信任、可扩展的新一代数值预报体系,是每一位大气科学工作者必须回答的时代命题。
END
声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编处理。