首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于SHAP值机器学习的江西暖季暴雨预报因子重要性分析
引用本文:夏侯杰,肖 安.基于SHAP值机器学习的江西暖季暴雨预报因子重要性分析[J].气象与减灾研究,2024,47(1):12-23.
作者姓名:夏侯杰  肖 安
作者单位:江西省气象台
基金项目:江西省气象局重点研究项目(编号:JX2020Z04);江西省科技厅重点研发项目(编号:20203BBGL73223);中国气象局创新发展专项 (编号:CXFZ2021Z012).
摘    要:机器学习模型(Machine Learning,ML)的不可解释性给其在气象业务中的应用带来了挑战。模型解释和可视化是解决这一问题的有效途径。文中将SHAP值应用于天气预报ML模型解释,研究了江西省暖季暴雨模型的预报因子对预报结果的影响。分别选取2016—2020年、2021—2022年4—9月ECWMF(European Centre for Medium-Range Weather Forecasts)高分辨率数值模式物理量及国家站降水观测数据进行XGBoost 建模与模型解释。结果表明,全局重要性排名前4位依次是总降水(重要性42.70%)、850 hPa比湿(重要性11.17%)、925 hPa相对湿度(重要性10.44%)、500 hPa相对湿度(重要性 9.16%)。个例分析表明,命中个例中高重要性物理因子在暴雨区的 SHAP 值较大,漏报(空报)个例在漏报(空报)区域高重要性物理因子的SHAP值偏小(偏大)。SHAP值从全局和局部可定量给出ML模型有物理意义的解释,解释结果与天气学原理和业务经验较一致,有利于ML在气象业务中的深入应用。

关 键 词:SHAP值,机器学习,暴雨,因子重要性,可解释性
收稿时间:2023/9/4 0:00:00
修稿时间:2023/11/23 0:00:00

Importance analysis on warm season rainstorm forecast factors in Jiangxi Province based on machine learning model of shapely values
Xia Houjie,Xiao An.Importance analysis on warm season rainstorm forecast factors in Jiangxi Province based on machine learning model of shapely values[J].Meteorology and Disaster Reduction Research,2024,47(1):12-23.
Authors:Xia Houjie  Xiao An
Institution:Jiangxi Meteorological Observatory
Abstract:
Keywords:shapely values  machine learning  rainstorm  factor importance  interpretability
点击此处可从《气象与减灾研究》浏览原始摘要信息
点击此处可从《气象与减灾研究》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号