准确的天气预报对于防灾减灾、农业规划和水资源管理等非常重要。传统的数值天气预报方法(NWP)提供了物理上可解释的高精度预报,但计算成本高,且无法充分利用快速增长的历史数据。近年来,人工智能方法在天气预报中取得了重大进展,但仍然存在挑战,例如平衡全球低分辨率和区域高分辨率的预报、在极端事件预报中过度平滑以及对动力系统建模不足等。为解决上述问题,清华大学地球系统科学系黄小猛教授研究团队联合多家机构,研发了基于图神经网络(GNNs)的全球区域嵌套的天气预报通用框架——OneForecast。相关论文以预印本形式在线发表(https://arxiv.org/abs/2502.00338),同时相关代码也已开源发布(https://github.com/YuanGao-YG/OneForecast)。

图1 OneForecast整体架构图
OneForecast主要由区域细化的多尺度图结构、多相流消息传递模块、神经嵌套网格方法等构成。对于区域细化的多尺度图结构,受多尺度图和多重网格的启发,OneForecast引入地球特定的基于区域细化的多尺度图结构,以建模复杂动力学系统中节点之间的相互作用。这种设计不仅可以建模各种尺度的大气运动,还能根据需要提升特定区域的预报精度。
此外,为解决复杂动态系统中节点之间信息传递不充分的问题,OneForecast提出多相流消息传递模块(Multi-stream Messaging,MSM),该模块由自适应消息传递机制组成,包括动态的多头门控边更新模块和多头节点注意机制。对于多头门控边更新模块,与传统的基于MLP的边更新方法不同,OneForecast引入动态门控和多头机制,以更精准地控制信息流。对于每条边,首先将其自身的特征与源节点和目标节点的特征拼接,其次通过两层MLP生成门控向量以调节信息流。随后,使用基于边相加的MLP(ESMLP)对边特征进行线性转换和非线性激活以更新边特征。最后,通过加权平均的方式将门控向量和更新后的边特征结合得到更新后的边特征。并且,与传统的节点更新方法相比,多头注意机制可以更精确地捕获节点之间的复杂关系,并通过注意力权重动态调整信息汇聚的方式。
虽然低分辨率模型的训练成本相对较低,但其预报细节不足。然而,直接使用高分辨率区域数据进行训练通常由于边界条件缺失或者数据量不足等原因而导致区域预报效果差。为了在全球低分模型的基础上实现特定区域的高分辨率预报,OneForecast提出神经嵌套的网格方法(Neural Nested Grid,NNG)。该方法将全球低分辨率的未来预报与区域高分辨率数据结合,以提高区域高分辨率预报的精度。NNG充分利用了全球模型信息并且为区域预报提供了必要的边界条件。
对于全球预报,OneForecast使用1.5°版本的WeatherBench2,该数据集是ERA5再分析数据的子集。其中,1959-2017年用于训练,2018-2019年用于验证,2020年用于测试。使用的数据包括5个13层压力层变量(位势(Z)、比湿(Q)、温度(T)、风速的分量(U)和(V))和4个地表变量(10米风速的分量(U10M)和(V10M)、2米温度(T2M)和海平面气压(MSLP))。对于区域高分辨率预报,使用0.25°分辨率的ERA5数据。OneForecast示范性地选取U10M和T2M进行区域高分辨率预报。
OneForecast评估了全球天气预报、区域高分辨率预报、极端事件预报、长期预报和集合预报的结果。对于1.5°全球天气预报,OneForecast 6h、1天、4天、7天、10天的预报结果与现有方法相比具有竞争力(每隔6h一个初始条件,共1300个初始条件的平均值)。具体来说,与Pangu、Fengwu、Graphcast和Fuxi相比,OneForecast在均方根误差(RMSE)和异常相关系数(ACC)两个指标上均取得了更好的结果。此外,OneForecast的预报结果在视觉上更符合物理一致性。

图2 全球天气预报定量评估

图3 单个变量全球预报定量评估

图4 10天预报结果
对于区域高分辨率预报,尽管Graph-EFM提出的区域预报方法提高了预报精度,但它仍然受高分辨率区域模型中缺少全球信息的限制。OneForecast提出的神经嵌套网格方法(NNG)结合了边界条件和全球未来信息,可实现更高精度的区域预报。此外,NNG充分利用了全球模型的预报结果,可以以极低的训练成本实现区域高分辨率预报。因此,OneForecast仅示范性地对两个变量(U10M、MSLP)进行区域高分辨预报,而无需使用所有变量进行训练(例如,用于训练全球模型的69个变量)。实验结果表明,仅使用区域数据进行训练时,长期推理结果差。Graph-EFM考虑了边界条件,提高了预报效果。OneForecast提出的NNG考虑了区域边界条件,并且充分利用了全球模型的未来预报信息,可实现区域长期稳定预报。

图5 区域高分辨率预报结果
此外,在对2018年台风Yagi和2020年台风Molave的预报中,OneForecast能够准确预报台风路径。尽管OneForecast使用的是较低分辨率(1.5°)的数据,但其在台风路径预报方面的能力与使用更高分辨率(0.25°)数据的基线模型相当。OneForecast提出的多相流传递模块(MSM)可以更好地捕获高频信息,从而在长期预报和极端事件预报中取得了令人满意的结果。

图6 极端事件(台风)预报评估(左);本文提出的MSM和传统基于MLP消息传递的谱偏差(右)
最后,该研究评估了长期预报和集合预报的结果。基于人工智能的天气预报模型通常不能实现长期稳定推理,该研究分析了表现最好的两个基线模型长时间推理的效果。例如,Pangu在100天的预报中出现伪影,而Graphcast由于误差累积过大导致物理场崩溃。相比之下,OneForecast可实现长期稳定推理,有效地捕获了大气状态,不会出现物理场崩溃等问题。此外,由于大气状态的初始条件具有不确定性,合理量化这种不确定性可以提升预报性能。OneForecast通过在初始条件中加入Perlin噪声实现集合预报。10个初始条件(每个具有50个集合成员)的4天、10天预报结果表明,OneForecast优于其他模型。此外,由于OneForecast可以准确建模大气状态,在短期如4天的预报中,确定性预报的结果更好,而其他模型由于误差过大等因素,短期预报仍需要使用集合预报方法来提高性能。

图7 100天长期推理评估(左);集合预报定量评估(右)
综上所述,OneForecast是一个基于多尺度图神经网络的全球区域嵌套的天气预报通用框架。通过将动力系统原理与多网格结构相结合,OneForecast具有重点区域细化的图结构,可建模各种尺度的大气运动并提高重点区域的预报精度。具有动态门控单元的多相流消息传递模块可缓解过度平滑并增强节点边缘特征表示,更好地捕获高频信息,提高了预报极端事件的能力。此外,提出的神经嵌套网格方法(NNG)可充分利用全球模型信息,有效缓解边界缺失的问题,提高了区域高分辨率预报的性能。实验结果表明,OneForecast在全球和区域尺度上实现了更高精度的天气预报,尤其是对于长期和极端事件的预报。这标志着基于人工智能的天气预报模型具有良好的潜力,逐渐成为传统数值方法的有力补充。
高分辨率数据往往能够解析更复杂的动力系统,未来OneForecast将平衡分辨率与计算成本,实现更高精度、更高效的天气预报。此外,地球系统是由多圈层构成的统一整体,更高精度的预报需要考虑多圈层之间的相互作用,团队即将发布基于图神经网络的大气-海洋耦合预报模型,以提升预报的准确性,尤其是提升极端事件的预报能力。
清华大学地球系统科学系教授黄小猛为论文通讯作者,博士生高远、硕士生吴昊(中科大信智学部-腾讯机器学习平台部联培硕士生)、博士生舒睿骐为论文共同第一作者。合作者包括中国科学技术大学信息智能学部硕士生董桓硕、许帆,清华大学交叉信息研究院姚班本科生陈锐,香港科技大学计算机科学与工程系博士生严一博,松鼠AI学习人工智能负责人兼首席科学家文青松,香港科技大学计算机科学与工程系助理教授胡旭明,南洋理工大学计算机科学与工程学院博士后王琨,香港理工大学电子计算系博士生吴家豪,香港理工大学电子计算系教授李青,香港科技大学计算机科学与工程系教授熊辉。研究受到国家重点研发计划和国家自然科学基金资助。
供稿:黄小猛研究团队
编辑:王佳音
审核:张强