北京师范大学张朝团队发布全球历史长时序四大主粮单产数据集(1982-2015)
- :北师大张朝团队
- :2025-03-14
近日,北京师范大学国家安全与应急管理学院粮食安全研究与教育团队(负责人:张朝教授)通过生态网络云平台(https://www.nesdc.org.cn)发布了1982-2015年全球四大粮食作物(玉米、水稻、小麦和大豆)5 arc-minute (~10km) 单产栅格数据集,用户可在线访问获取数据。相关研究成果以“Mapping global yields of four major crops at 5-minute resolution from 1982 to 2015 using multi-source data and machine learning”为题发表在Scientific Data 期刊。
随着气候和环境的持续恶化,全球粮食安全面临严峻的挑战。大多数学者认为增加单位面积的产量(即单产)是目前提高粮食总产、实现粮食可持续发展最切实可行的途径之一。在此背景下,具有长时间、较高精度和覆盖全球的历史粮食作物网格单产数据集能够从全球视角协调区域农作物生产系统的管理,从而及时调控粮食市场。然而,团队通过总结现有公开共享的全球作物单产数据集,发现它们在时间连续性、空间分辨率以及数据来源等方面存在一定的局限性。整体来看,全球网格化单产数据集存在未能及时更新、时空分辨率低和精度亟待提高等问题。因此,团队基于多源时空涉农数据和多种机器学习算法来估算了全球四大粮食作物的单产(图1),发布了一个新的全球作物单产数据集(GlobalCropYield5min),其具有较高的空间分辨率(~10km)和较长的时间尺度(1980-2015)。
图1. GlobalCropYield5min数据集生产流程图
结果表明:在全球尺度上,估产精度最好的小麦,R²为0.95,RMSE(NRMSE)为460.5 kg/ha(13.1%);其次是玉米,R²为0.93,平均RMSE(NRMSE)为757.1 kg/ha(17.8%)。水稻R²为0.90,平均RMSE(NRMSE)分别为630.4 kg/ha(18.3%)。大豆的估产精度相对其他三种作物表现稍次之,R²为0.86,RMSE(NRMSE)值分别为307.7 kg/ha(15.3%)。而针对作物主产国的分析表明依然是小麦精度最高,最佳模型的R²值范围为0.84-0.91,RMSE和NRMSE的范围分别为274.3 kg/ha-529.2 kg/ha和5.6%-16.7%。对于玉米而言,墨西哥和乌克兰的估产精度最高,R²分别为0.90和0.92,RMSE(NRMSE)分别为492.1 kg/ha(21.2%)和388.9 kg/ha(10.7%)。对于水稻,孟加拉国的估产精度最高(R²为0.90,RMSE和NRMSE分别是295.1 kg/ha和9.8%)。大豆R²范围在0.72-0.85,RMSE的范围在168.2-400 kg/ha,NRMSE在7.2-18.3%之间。总体而言,估产精度因作物类型、年份和国家而存在差异,但整体效果较好(图2)。
图 2. 前七个主产国和全球尺度的估产精度
团队进一步对比当前主流的SPAM和GDHY全球产量数据集(图3),发现GlobalCropYield5min与实际记录产量数据集的R²值范围在0.73至0.86之间,表现优异。其次是SPAM产品,其R²值范围为0.44至0.82。而在GDHY数据集中,R²值范围仅为0.01至0.39,表现欠佳。这可能是因为GlobalCropYield5min和SPAM的产量数据集是从所有次级国家行政单元收集的,而GDHY则是基于FAO国家尺度的统计数据生产的,其空间分辨率仅为0.5°。此外,GlobalCropYield5min的模拟精度不仅在空间上略优于SPAM产量数据集,而且能够提供从1982年至2015年连续34年的时间覆盖,而SPAM仅有2000年、2005年和2010年的数据。
图3. 全球尺度GlobalCropYield5min、SPAM和GDHY与实际单产的散点分布
GlobalCropYield5min数据集不确定性的空间分布如图4所示,玉米、水稻、小麦和大豆的NRMSE分别为25.7%、22.1%、23.7%和22.1%。其中玉米、水稻、小麦和大豆分别有83.6%、72.9%、74.6%和78.4%的网格NRMSE低于30%,表明整体上GlobalCropYield5min数据集的不确定性较低。玉米不确定性较高的区域(NRMSE > 40%)主要集中在巴西东北部、阿根廷北部、中国东北部和菲律宾;水稻分布在中国西南部、巴基斯坦中部和巴西西北部;小麦分布在中国东北部和澳大利亚西部的小麦;巴西南部和中国北部的大豆也存在较高的不确定性。
图4. GlobalCropYield5min数据集不确定性的空间分布
GlobalCropYield5min数据集在时间覆盖、空间分辨率和模拟精度等方面都取得了一定的改进,可用于区域及全球尺度粮食系统的研究,为开展气候-作物产量关系、粮食生产潜力以及农业灾害风险和适应性分析提供有力的数据支撑。
该项研究工作和数据制备得到了国家自然科学基金(42061144003,41977405)、中国博士后基金(2023M743450)、国家资助博士后研究人员计划(GZC20232614)等资助。
论文信息:Cao, Juan, Zhao Zhang, Xiangzhong Luo, Yuchuan Luo, Jialu Xu, Jun Xie, Jichong Han, and Fulu Tao. "Mapping global yields of four major crops at 5-minute resolution from 1982 to 2015 using multi-source data and machine learning." Scientific Data 12, no. 1 (2025): 357.