作者:张郑良,李姝
编辑:李宝珠
转载请联系本公众号获得授权
浙江大学地球科学学院提出了具有增强可解释性的地理神经网络加权回归模型 (EI-GNNWR),为全面理解青藏高原的热流分布及其地球动力学机制提供了重要的见解。
在地球科学研究中,地表热流 (Surface Heat Flow, SHF) 作为地球深层热能释放的重要表征,一直备受关注。地表热流不仅是地球内部能量驱动的一面「窗口」,更是揭示地壳热结构、地幔热动力学及地质构造演化的关键参数。通过对地表热流的研究,我们能够深入了解地球内部的热力机制,揭示板块俯冲、地幔上升及裂谷扩张等地质现象背后的动力学过程。
尽管地表热流研究在过去几十年中取得了诸多进展,但在全球范围内,某些区域、特别是青藏高原这样的复杂构造带,仍然存在大量的未解之谜。
作为地球「第三极」,青藏高原以其巨大的地貌高差和复杂的构造特征成为研究地球动力学的天然实验室。自印度板块与欧亚板块的碰撞以来,这片区域经历了剧烈的构造活动,形成了多样化的地质单元和热异常现象。近年来的研究发现,青藏高原的地表热流在地理空间上具有显著的不均匀性:高热流值集中在雅鲁藏布江缝合带和南北向裂谷带,而其他区域的热流分布则相对较低。然而,由于测量点的稀缺性及覆盖范围的有限性,对这一热流分布规律的定量化解析仍存在重大技术瓶颈。尤其是在那些地势险峻、人迹罕至的区域,传统的钻孔测量方法和观测设备难以大规模展开,导致这些区域的地表热流数据几乎为空白。
为解决这一问题,浙江大学地球科学学院提出了一种空间智能方法——具有增强可解释性的地理神经网络加权回归模型 (EI-GNNWR)。该方法通过整合地球物理和地质数据的空间异质性特征,捕捉地表热流的非线性关系,为全面理解青藏高原的热流分布及其地球动力学机制提供了全新的研究框架和技术支持。
相关研究以「The Distribution of Surface Heat Flow on the Tibetan Plateau Revealed by Data‐Driven Methods」为题,发表在地球科学领域知名期刊 Journal of Geophysical Research: Solid Earth 上。
研究亮点:
* 提出了一种充分考虑地质结构信息和地球物理数据的可解释性数据驱动方法:EI-GNNWR 模型
* EI-GNNWR 模型精确地预测了澳大利亚以及青藏高原的地表热流图,预测精度显著高于 XGBoost、FCNN、OLR 和 GWR 四大模型,有效弥补了青藏高原地区地表热流数据的不足
* EI-GNNWR 模型有效地揭示了青藏高原地表热流分布情况及其影响机制
论文地址:
https://doi.org/10.1029/2023JB028491
关注公众号,后台回复「青藏高原地表热流」获取完整 PDF
开源项目「awesome-ai4s」汇集了百余篇 AI4S 论文解读,并提供海量数据集与工具:
https://github.com/hyperai/awesome-ai4s
基于青藏高原和全球汇编的地表热流数据集进行模型训练
研究人员将全球汇编的地表热流数据集、 NGHF 陆地热流数据集与我国关于青藏高原地区的地表热流数据集进行了合并,并剔除了海洋测量数据以及所有被标注为「D: 数据未用于热流图」的测量数据,形成最初的数据集。
中国大陆地区地表热流数据集地址:
https://go.hyper.ai/oYfAz
由于青藏高原的实测数据集较少,现有观测主要集中于高原边缘,内部区域了解有限。因此研究人员将周边板块的地表热流测量数据纳入其中来扩充数据集。
青藏高原及其周边微板块地表热流测量数据分布图
本研究中使用了 220 个地表热流测量点,其中 90% 用于模型的训练和验证数据集,10% 用于测试数据集,以验证模型的准确性。为了提高实验精度,研究人员在模型训练和验证阶段采用了交叉验证技术。
此外,在数据稀缺的青藏高原地区预测地表热流值,需要拟合该数值与地球物理和地质特征之间的关系。为此,研究人员选取了一些与地表热流相关的关键特征,如下表所示。
研究中使用的地球物理与地质特征数据
在 GNNWR 模型的基础上,引入 SHAP 值计算方法
青藏高原的地表热流测量数据较为有限,并表现出显著的空间非平稳性。此外,如下图所示,非参数局部加权散点平滑 (LOWESS) 趋势线显示了莫霍面深度、地形、构造单元以及到年轻裂谷距离等参数与地表热流之间的显著波动,说明地表热流与地质和地球物理参数之间存在复杂的非线性关系。
地球物理及地质特征与地表热流值的散点图
针对于此,研究人员采用了 GNNWR 模型。该模型将普通线性回归 (OLR) 与神经网络算法相结合,能够精确捕捉空间非平稳性,从而为地表热流与地质和地球物理数据的相关性建立了一个稳健的回归框架。
为了进一步提高 GNNWR 模型的可解释性,并精确量化每个变量对地表热流值的贡献,研究人员采用了 SHapley Additive exPlanations (SHAP) 值计算方法。通过这种方法,可以量化局部交互作用,并为特定预测中的各个特征分配重要性值,从而提供更详细的局部细微解释。在这种整合方式的基础上,研究人员提出了具有增强可解释性的地理神经网络加权回归模型 (EI-GNNWR) 。
SHAP 相关教程地址:
https://go.hyper.ai/deK6H
EI-GNNWR 模型预测精度显著高于其他模型
为了测试 EI-GNNWR 模型的有效性,研究人员选择地热数据广泛且精度较高的澳大利亚地区进行验证。
由于澳大利亚地区是广泛地热勘探的中心,拥有丰富且相对准确的地表热流测量数据,是数据驱动方法有效性的理想试验场。基于此,研究人员首先选择在澳大利亚地区进行模型测试,并与 4 种不同模型对澳大利亚地表热流空间分布的预测结果进行了比较。这些模型分别为极端梯度提升 (XGBoost)、全连接神经网络 (FCNN)、普通线性回归 (OLR) 和地理加权回归 (GWR) 模型。
评估结果如下图所示,EI-GNNWR 模型在预测性能上表现优越,其 R² 值为 0.823,分别比 XGBoost、FCNN、OLR和 GWR 模型高出 36%、31%、22% 和 4%。此外,其归一化 RMSE 仅为 0.10,相较于 XGBoost、FCNN、OLR 和 GWR 模型分别降低了 47%、50%、44.4% 和 23%。与澳大利亚地区 XGBoost 模型的先前 R² 值相比,该模型提高了 17%;归一化 RMSE 也比之前报告的值降低了 55%。
* 模型的 R² 是用来评估模型拟合效果的一个统计指标,R² 越高,说明模型的拟合效果越好,预测性能越好
* RMSE (均方根误差)是一种评估回归模型预测误差的常用指标,用来衡量模型预测值与真实值之间的差距,RMSE 越小,表明模型的预测更接近真实值
图3 澳大利亚地区地表热流预测模型比较评估
(a) EI-GNNWR 模型
(b) GWR 模型
(c) XGBoost 模型
(d) FCNN 模型
(e) OLR 模型
地图上的圆圈表示测量点,相邻的散点图 (f–j) 显示了实测地表热流值与模型预测值之间的关系。
基于空间智能方法揭示青藏高原地表热流分布
在澳大利亚地区验证 EI-GNNWR 方法的有效性后,研究人员利用来自青藏高原及其周边区域的地表热流测量点训练了新模型。
研究结果表明,模型具有较高的预测精度,其 R² 值为 0.91,归一化 RMSE 为 0.07,误差水平控制在 7% 以内。研究人员制作了青藏高原的地表热流 (SHF) 分布图,如下图所示,青藏高原的平均热流值为 66.2 mW/m²,显著高于全球平均值 62.8 mW/m²。作为全球构造活动最强烈的地区之一,青藏高原的热流分布不均匀。高热流区域主要集中在南部、东北部和东南部,特别是雅鲁藏布缝合带、高原东北边界以及云南西部的腾冲地区。
通过 EI-GNNWR 模型预测的青藏高原地表热流空间分布图
为了更好地理解地热形成的决定因素,研究人员还分析了 EI-GNNWR 模型中 SHAP 值的空间分布(如下图所示),重点关注地质和地球物理变量的作用。该方法明确了每个变量对地表热流形成的具体贡献,并阐明了这些变量与地热活动之间的关系。
通过聚焦于青藏高原西南部的热流模式,研究人员探索了地质和地球物理因素在塑造地热能产生中的相互作用。以雅鲁藏布江与怒江之间的区域为例 (下图 Ⅰ 区),预测的地表热流值超过 90 mW/m²。SHAP 值表明,距离山脊和重力平均曲率对地表热流的增加有积极作用,这与喜马拉雅造山带的局部熔融及高地表热流值一致。重力平均曲率对地热异常的形成有显著影响,尤其在低地震速度带的造山带熔融区表现突出。
在下图 Ⅱ 区,显著较高的地表热流值与山脊的接近性和地形复杂性密切相关。地壳年轻区域的山脊通过地幔物质上升影响地表热流值,同时地形变化塑造了地热分布和强度,形成了该区域特有的地热模式。
青藏高原预测的地表热流地图及影响该数值的重要地质和地球物理参数的 SHAP 值空间分布
以 GNNWR 为基础,助力多领域地学应用
2020 年,浙江大学地球科学学院的研究人员提出了地理神经网络加权回归 (GNNWR),这是一种用于解决具有复杂地理过程的各个域中空间不平稳性的模型。以此模型为基础,研究人员进一步提出了用于海洋学、地理学、大气科学和地质学等多个方向的系列模型,累积发表相关论文超 30 篇。
论文地址:
https://www.tandfonline.com/doi/full/10.1080/13658816.2019.1707834
GNNWR 开源地址:
https://github.com/zjuwss/gnnwr
具体而言,在房价分析领域,为解决抽象的「空间邻近性」无法构造损失函数、神经网络难以训练的问题,研究人员将 OSP 与 GNNWR 进一步结合,构建了 osp-GNNWR 模型。通过模拟数据集和武汉市房价实证案例的研究,该模型被证明具有更好的全局性能,能更准确地描述复杂的空间过程和地理现象。
点击阅读详细报道:精准预测武汉房价!浙大GIS实验室提出osp-GNNWR模型:准确描述复杂空间过程和地理现象
在大学科学领域,GNNWR 模型能够建立空间非平稳的回归关系,估算 PM2.5 浓度,提供全国范围内高精度、细节合理的 PM2.5 分布情况。例如,通过地理空间建模我们发现,从北京到连云港,PM2.5 浓度普遍较高,这可能是受风向、风速等因素的影响,此外,特定区域内的防护林可能会抑制 PM2.5 的扩散。
相关论文以「Satellite-Based Mapping of High-Resolution Ground-Level PM(2.5) with VIIRS IP AOD in China through Spatially Neural Network Weighted Regression」为题,发表在 MDPI 上。
论文地址:
https://www.mdpi.com/2072-4292/13/10/1979
在地质学领域,特别是在金矿空间分布预测方面,GNNWR 模型集成了空间模式 (spatial patterns) 和神经网络,结合 Shapley 加性解释理论,不但能够大幅提升预测的准确性,并且能够在复杂的空间场景中提升矿物预测的可解释性。
点击查看详细报道:优于五大先进模型,浙江大学杜震洪团队提出 GNNWLR 模型:提升成矿预测准确性
在海洋生态环境建模方面,研究人员提出了一种全新的深度学习预测模型 ChloroFormer,该模型将傅里叶分析和 Transformer 神经网络结合,采用时序分解架构,有效地改进了 chl-a 浓度预测的准确性。此外,研究人员还在 2 个不同沿海研究区域开展实验,结果表明,所提模型不仅在多步预测准确性上优于其他 6 种对比模型,在极端和频繁的藻华情况下也能保持相对优势。
点击查看详细报道:深度学习对抗海洋赤潮危机!浙大GIS实验室提出ChloroFormer模型,可提前预警海洋藻类爆发
未来,团队致力于充分发展 GIS 理论与方法、地学智能分析平台技术,持续探索 GeoAI 发展。
GNNWR 课题组负责人吴森森研究员的个人主页及时空智能回归模型简介:
https://mypage.zju.edu.cn/wusensen/#977161
戳“阅读原文”,免费获取海量数据集资源!
(文:HyperAI超神经)