
作者:「问海」大模型研发团队
编辑:李宝珠
本文已获得「问海」大模型研发团队授权报道,转载请联系本公众号,并标明来源
崂山实验室吴立新院士领衔的科研团队,通过物理海洋学与人工智能的深度融合,以海洋动力学理论驱动神经网络架构设计,研制了「问海」—— 全球高分辨率 (1/12°) 海洋环境智能预报大模型。
海洋中活跃着各种时空尺度的涡旋。其中,空间尺度在 10km 到 100km 量级的中尺度涡旋是海洋动能的主要载体,主导者海水流速、温度和盐度的短期变化,并对大气过程产生重要的影响。因此,准确预测中尺度涡旋不仅对海洋活动和管理至关重要,而且对提高天气预报的准确性也有重要帮助。
过去,海洋学家主要通过数值求解大型物理方程组来预报未来海洋的变化。在数值求解的过程中,随着网格分辨率增加,计算负担迅速增长,这导致预测海洋中尺度涡旋需要消耗巨大计算资源。近年来,人工智能 (AI) 为科学研究带来了全新方法和有力工具,在天气预报方面取得了重要进展。然而,现有的 AI 大模型仍存在对海气相互作用表征不充分,预报结果模糊化等问题,给实现精细化海洋环境预报带来了挑战。
针对于此,崂山实验室吴立新院士领衔的科研团队,联合中国海洋大学、中国科学技术大学、青岛国实科技集团有限公司,通过物理海洋学与人工智能的深度融合,以海洋动力学理论驱动神经网络架构设计,研制了「问海」—— 全球高分辨率 (1/12°) 海洋环境智能预报大模型。
相关研究成果以「Forecasting the Eddying Ocean with a Deep Neural Network」为题,在线发表于 Nature Communications。
研究亮点:
* 「问海」大模型以海洋动力学理论驱动神经网络架构设计
* 「问海」大模型预报性能优于法国麦卡托海洋国际中心发布的数值预报系统
* 「问海」大模型相较于数值预报模型在计算效率方面提升了 3,000 倍
论文地址:
https://www.nature.com/articles/s41467-025-57389-2
关注公众号,后台回复「问海」获取完整 PDF
开源项目「awesome-ai4s」汇集了 200 余篇 AI4S 论文解读,并提供海量数据集与工具:
https://github.com/hyperai/awesome-ai4s
数据集:将海洋观测数据作为真实值
该研究使用的数据主要包括用于训练模型的海洋和大气再分析数据,以及用于评估模型预报能力的观测数据。再分析数据包括法国麦卡托海洋国际中心的 GLORYS 全球 1/12° 海洋再分析数据,和欧洲中期天气预报中心的 ERA5全球 1/4° 大气再分析数据。
区别于现有AI气象大模型基本都以再分析数据作为初始场来进行预报,该研究严格采用与海洋数值预报系统一致的初始场和强迫场来驱动大模型,并将海洋观测数据作为真实值,客观评估问海大模型与海洋数值预报系统的实际预报能力。
海洋初始场来自法国麦卡托海洋国际中心 GLO12v4 预报系统,大气预报场来自欧洲中期天气预报中心 IFS HRES 预报系统,观测数据包括 Argo 测量的温盐剖面、卫星遥感的海表面高度以及漂流浮标测量的海表面温度和近海表流速。
模型框架:海洋动力学理论驱动神经网络架构设计
现有的 AI 大模型存在对海气相互作用表征不充分,预报结果模糊化等问题,给实现精细化海洋环境预报带来了挑战。通过物理海洋学与人工智能的深度融合,以海洋动力学理论驱动神经网络架构设计,有效克服了现有 AI 大模型的不足。
「问海」大模型将块体公式 (bulk formula) 显式嵌入神经网络,准确表征了海-气间的动量、热量和物质交换;利用海陆分布掩码,赋予模型对地形岸界的感知能力;以海洋状态的变化趋势作为预报目标,使模型更加关注快变的中小尺度过程;通过优化神经网络超参数,减少下采样过程中的信息损失,强化对海洋中小尺度过程的保真能力;使用微调技术,改善了迭代预报过程中的累积误差。
「问海」大模型架构示意图
实验结论:「问海」大模型预报能力优于数值海洋预报系统
海洋中小尺度过程非线性强,可预报性低;且海洋观测稀疏,同化系统给出的初始场与真实海洋状态存在偏差。因此,很难要求预报的中小尺度过程与实际观测在位置、强度都上都完全吻合。特别的,由于「双惩罚」问题的存在,传统的点对点误差指标,如均方根误差 (RMSE),并不适用于评估高分辨率预报系统的性能。因为这类指标会使得高分辨率预报系统的性能「看起来」不如低分辨率系统,即使前者能够更好地反映真实海洋的状态。
「双惩罚」问题示意图,来源:ECMWF
为了公平对比「问海」大模型与 GLO12v4 数值预报系统,该研究采用面向高分辨率预报系统的「近邻」评估 (neighbourhood evaluation) 方案——将观测值周围一定范围内的预报值作为观测位置的集合预报,评估其连续排名概率得分 (CRPS)。2024 年 4 月至 11 月的回报结果表明,「问海」大模型对于未来 10 天的温度、盐度、流速、海平面高度的预报性能优于 GLO12v4 数值预报系统。与此同时,「问海」大模型相较于数值预报模型在计算效率方面提升了 3,000 倍,极大地节省了计算时间和能源消耗。
「问海」大模型(蓝线)和法国麦卡托海洋国际中心 GLO12v4 数值预报系统(红线)在2024年4月至11月期间的预报结果的连续排名概率得分(CRPS,越低越好)。
(a) 温度剖面
(b) 盐度剖面
(c) 海表面温度
(d) 海平面异常
(e) 15米纬向流速以及
(f) 15米经向流速。其中温盐剖面展示的为垂向平均的 CRPS。阴影表示使用 bootstrap 方法得到的 50% 置信区间


戳“阅读原文”,免费获取海量数据集资源!
(文:HyperAI超神经)