本文介绍MODIS GPP系列产品(MOD17)的基本情况,及其在全球生态学领域的应用价值、精度表现与核心局限,从而探讨其数据是否可靠。
最近有幸和一位大佬交流,提到MODIS的GPP数据产品;大佬说这个GPP产品质量存在争议,最好更换为其他GPP产品使用,或保留MODIS的同时增加其他GPP数据产品作为验证。
所以,MODIS的GPP数据产品是否可靠、到底能不能用?如果不可靠,是哪一个环节出了问题?正好趁着这个机会,稍微研究一下。
先插一句,如果需要详细了解全球还有哪些其他GPP数据产品,可以参考文章全球植被生产力GPP、NPP数据下载平台合集。
如果要做任何与陆地碳循环相关的研究,几乎不可能不接触MODIS GPP数据。这个由美国NASA发布的全球植被总初级生产力(GPP)遥感产品,正式编号为MOD17,搭载于Terra卫星上的中分辨率成像光谱仪(MODIS)传感器,自2000年2月起持续运行至今,是目前历史最长、覆盖最广的全球尺度GPP遥感产品。如下图所示。

而对于使用Aqua卫星数据的用户,对应产品编号为MYD17,算法与MOD17完全一致,两者可配合使用以提高时间采样频率,如下图所示。

MOD17系列下设若干细分产品,最常用的有两大类。
第一类是8天合成GPP产品,编号MOD17A2H(当前版本V6.1),空间分辨率500米,时间分辨率为每8天一景,采用正弦投影(Sinusoidal)分幅存储,全球共覆盖460余个瓦片(tile),时间范围从2000年2月持续至今。该产品包含GPP波段和净光合量(PSN = GPP − 维持呼吸 MR)波段,以及对应的质量控制(QC)层。需要注意的是,MOD17A2H是近实时产品,云污染导致的低质量LAI/FPAR像元会被保留,用户必须根据QC标记自行过滤,否则会引入可观的噪声。

第二类是对应的Gap-Filled(空缺填补)版本,即8天产品MOD17A2HGF和年度产品MOD17A3HGF,这也是目前学术研究中引用最多的版本。Gap-Filled产品在年底完整获取全年8天LAI/FPAR时间序列后统一生成,对所有未达质量标准的像元进行线性插值填补,从而显著减少云污染造成的数据空缺。MOD17A3HGF同时提供年度GPP和NPP数据,空间分辨率同为500米。顾名思义,Gap-Filled产品无法实时获取,通常需要等到次年初才能访问当年的完整数据集。

总的来说,MOD和MYD是区分卫星的,A2和A3是区分时间分辨率的,无GF和有GF是区分是否Gap-Filled的。
此外,还有一个版本问题,也就是MODIS的6和6.1版本。但是好像GPP这个数据比较特殊,其新版本,也就是6.1版本,时间跨度没那么大,所以对于部分时间,还是得用6版本。
MOD17A2H的GPP波段以整型数值存储,需乘以比例因子(scale factor)0.0001后才能转换为实际物理量,单位为 kg C m⁻² per 8 days(即每个8天合成期内每平方米固定的碳量,以千克计)。如需换算为日均值,还需再除以8;若希望使用生态学研究中更常见的单位 g C m⁻² d⁻¹,则需将原始数值乘以0.0001×1000÷8,即乘以0.0125。年度产品(MOD17A3HGF)的GPP单位则为 kg C m⁻² yr⁻¹,是该年全部8天GPP值的累加。
此外,不同数据下载来源(比如MODIS官方平台和GEE)对应的比例因子、单位,以及数据格式、波段组成等可能有所不同,需要大家下载时做好攻略。

MOD17的核心计算框架是光能利用效率(Light Use Efficiency,LUE)模型。

LUE模型的基本公式为:
其中, 是最大光能利用效率(单位 g C MJ⁻¹),由BPLUT(生物群系参数查找表,Biome Parameter Look-Up Table)根据土地覆盖类型赋值,不同植被功能型对应不同的固定常数; 和 是温度和饱和水汽压差的胁迫标量(取值范围0–1),当日最低温度过低或VPD过高时将线性衰减GPP;FPAR(光合有效辐射吸收比例)来自MOD15A2H产品,基于MODIS反射率波段反演得到;PAR(光合有效辐射)则来自NASA的全球气象再分析数据,Collection 6.1版本使用MERRA-2(Modern-Era Retrospective Analysis for Research and Applications, Version 2)提供的地表短波辐射作为驱动。
这个框架简洁而优雅,计算量小,适合全球业务化运行。但正如后文将详述的,它的每一个组成部分都携带着或大或小的不确定性,而这些不确定性的叠加,造就了MOD17在精度层面相当复杂的问题。
尽管算法存在局限,MOD17在宏观尺度上的表现仍为其全球应用提供了基本的合理性。全球总GPP与大气CO₂增长率及ENSO指数之间存在显著负相关,本身就证明了MOD17能够捕捉生态系统对气候变异的响应(Running et al., 2004; Zhao et al., 2006)。
从趋势上看,2000至2018年MOD17检测到的全球GPP以约0.47 PgC yr⁻²的速率增长,与基于太阳诱导荧光(SIF)、FLUXCOM等独立数据产品在方向上保持一致,为"全球变绿"这一现象提供了长达二十余年的连续证据(Endsley et al., 2023)。

然而,"可靠"和"准确"是两回事。MOD17在宏观趋势上的表现,掩盖了它在精度层面相当复杂的问题。
理解MODIS GPP的精度问题,有一个核心规律值得记住:它倾向于在高生产力区域低估GPP,同时在低生产力区域高估GPP。
在巴西热带生态系统的多站点研究中,MOD17在低产站点的高估偏差高达111%至584%,而在高产站点则低估了2%至18%,且总体上无法捕捉热带生态系统(尤其赤道站点)的GPP季节性动态。针对全球玉米农田的评估显示,年度GPP低估幅度达6%至58%。用FLUXNET2015数据集对最新版本MOD17A2H进行系统验证,年度GPP的决定系数仅为R²=0.62,在8天时间步长下更降至R²=0.52——这对于一个全球通用产品而言,精度并不算高(Wang et al., 2017)。

这一双向误差的根源,在于MOD17采用的"大叶"(big-leaf)模型框架。冠层中阳叶和阴叶对光的响应方式截然不同:阳叶接受直射光容易达到光饱和,而阴叶在散射光下仍能维持较高效率。大叶模型将整个冠层视为一张均匀受光的叶片,这在低LAI(叶面积指数)的稀疏植被下尚可接受,但一旦进入郁闭的高生产力生态系统,阴叶对总GPP的贡献就会被严重低估。Ma等(2024)针对这一问题开发了双叶改进版本CTL-MOD17,在153个全球FLUXNET站点验证,R²提升了0.07,RMSE降低117 g C m⁻² yr⁻¹,并有效消除了高低LAI区域的系统性偏差——这从侧面证实了大叶框架是MOD17精度瓶颈的核心所在。
气象驱动数据的空间尺度错配是另一个不可忽视的误差来源。MOD17使用的MERRA-2再分析气象数据分辨率约为0.5°×0.625°(早期版本约1°×1.25°),而MODIS像元为500米,两者之间存在数十倍乃至上百倍的尺度差异。不同再分析数据集(NCEP、ECMWF、DAO)驱动的全球GPP估算差异可超过20 PgC yr⁻¹,热带地区尤为显著(Zhao et al., 2006)。此外,MODIS FPAR产品在云覆盖条件下受噪声影响明显,在热带雨林(郁闭度高、云频繁)和干旱区(裸土背景信号强)的质量尤其值得警惕(Yan et al., 2025)。
精度问题或许可以通过参数优化来改善,但MODIS GPP有几个更深层次的局限,涉及算法框架本身,难以通过"打补丁"解决。
第一个是对CO₂施肥效应的系统性忽视。自工业革命以来,大气CO₂浓度从约280 ppm持续上升至今日超过420 ppm,这对陆地植被光合作用的促进效应(即CO₂施肥)已被多条独立证据链证实。Keenan等(2023)综合陆地生物圈模型、生态优化理论、遥感方法与全球碳收支约束,估计CO₂施肥使1981至2020年间全球年均陆地光合作用增加了约13.5%(15.9 PgC)。然而,MOD17的LUE算法从未将这一生理效应纳入,也没有随CO₂浓度变化动态调整光能利用效率参数。这直接导致它在反映过去几十年全球GPP增长趋势时存在系统性低估——趋势方向对,但幅度被压缩了。基于这一认识,MCI GPP集成产品(2001–2023年全球均值为141.9±4.0 PgC yr⁻¹)通过机器学习方法部分规避了这一问题,在AmeriFlux独立验证中R²达0.72,优于MOD17(Pu et al., 2025)。

第二个是水分胁迫机制的过度简化。MOD17使用VPD(饱和水汽压差)作为大气干旱对光合作用限制的代理变量,但完全忽略了土壤水分的独立约束作用。在干旱和半干旱生态系统中,植被的水分获取受制于土壤有效水含量,而非仅仅大气湿度。正因如此,MODIS GPP在夏季干旱期(如地中海常绿林、东亚季风区干季)会显著高估实际碳吸收,且无法捕捉极端干旱年份对GPP的抑制——东亚山地流域的生态水文模型研究表明,MODIS GPP未能重现2001年严重干旱对年际GPP的明显压制,其根源正是算法对土壤水分胁迫的简化处理。更根本的问题在于,生态学研究已表明植被对水分胁迫的响应具有气候适应性——干旱气候下的生态系统并不简单地套用湿润气候的胁迫函数,但这种适应性在MOD17中完全缺失。
第三个是土地覆盖分类误差的传导放大。MOD17通过BPLUT将土地覆盖类型映射至等关键参数,土地覆盖分类的任何偏差都会被直接传导进GPP估算。夏威夷的案例研究清晰地量化了这一问题:仅将全球土地覆盖产品(MOD12Q1)替换为本地精细数据,区域GPP估算就降低了约8%;同时引入本地高分辨率气候数据又降低了约8%,两者叠加使区域总GPP低估了约16%(Kibler et al., 2017)。在土地覆盖类型复杂多变的热带地区和农业景观,这类误差会更加显著。此外,BPLUT中参数对各生物群系而言是固定常数,无法反映同一植被类型内部因氮素状况、树龄、扰动历史等因素造成的光合能力空间异质性。
上述所有问题,都因一个更基础的困境而难以被充分校正:全球FLUXNET通量塔网络在地理上存在严重偏倚。北美、欧洲和东亚温带地区的站点相对密集,而非洲、南美洲热带区域和中亚干旱区的站点极度稀缺。这意味着,MOD17算法的BPLUT参数在高度不确定的区域既缺乏充分的校准基础,也缺乏有效的独立验证手段。
Pu等(2025)明确指出,通量塔的稀疏分布导致了显著的地理偏差,严重制约了全球GPP产品的系统性区域验证。正因如此,热带常绿阔叶林的GPP季节性动态至今仍是MOD17最薄弱的环节——那里的雨季旱季转换、林冠更新动态,现有的算法框架和验证体系都难以准确捕捉。
MODIS MOD17 GPP并没有被"淘汰",而且在可预见的未来也不会。它的价值在于:没有其他产品能在2000年以来提供如此长时序、如此一致的全球覆盖。在北半球温带和寒带生态系统的年际到年代际趋势研究中,MOD17仍是最可靠的基础参照数据集。NASA也已推出基于VIIRS传感器的VNP17产品,可将这一记录延续至2030年代乃至更远(Roman et al., 2024; Endsley et al., 2023)。

但如果你的研究关注的是热带生态系统、干旱区的碳通量、长期GPP绝对量的变化幅度,或者需要在区域精细尺度上使用GPP数据,就有必要认真评估MOD17的适用边界,并考虑引入补充或替代方案。基于SIF的GPP产品(GOSIF、OCO-2衍生产品)在捕捉光合生理动态方面具有明显优势;FLUXCOM-X通过机器学习上推提供了与过程模型不同视角的估算;MCI GPP则通过集成方法部分规避了单一LUE框架的系统性偏差。将多源产品交叉验证,并尽可能结合当地通量塔实测数据进行区域校正,是目前相对稳健的研究策略。
实际使用时还有几点工程层面的注意事项:如果研究对数据完整性要求较高(例如计算年际变化时不希望因云污染造成缺失),应优先选用Gap-Filled版本(MOD17A2HGF或MOD17A3HGF),而非原始近实时产品(MOD17A2H);在进行像元尺度的定量分析前,务必对原始数字量值乘以比例因子(0.0001)并根据QC标记剔除低质量像元;对于年际趋势分析,年度Gap-Filled产品(MOD17A3HGF)是最常用的选择,也是绝大多数全球生态学文献中所用的具体数据版本。
归根结底,MODIS GPP是一个时代的产物——它在数据匮乏的年代为全球碳循环研究提供了第一扇窗口,这份贡献毋庸置疑。但随着新一代传感器、更丰富的通量观测网络和机器学习方法的涌现,我们对GPP的估算正在进入一个更精细、更具机制性认知的新阶段。理解MOD17的边界,正是走向这个新阶段的必要一步。
所以是否可靠?能不能研究的时候用?
其实答案就是开头那位大佬说的:可以用,但别单独用。
不过可以再补一句:如果是想发大一些的研究,那审稿人大概率会问到这个问题,那就别单独用。如果是其他研究,甚至是做课程设计这种小应用,那其实也可以直接无脑单独用。
最后一个问题:那如果想要更换其他的GPP数据产品,可以使用哪些呢——参考文章全球植被生产力GPP、NPP数据下载平台合集即可。
欢迎关注:疯狂学习GIS