春季中国日最高气温延伸期预报误差分析及订正

第36卷第6期2020年12月
热带气象学报
三国鼎立形势图
JOURNAL OF TROPICAL METEOROLOGY
Vol.36,No.6Dec.,2020
熊敏诠,代刊,唐健.春季中国日最高气温延伸期预报误差分析及订正[J].热带气象学报,2020,36(6):795-804
文章编号:1004-4965(2020)06-0795-10
春季中国日最高气温延伸期预报误差分析及订正
熊敏诠,代刊,唐健
(国家气象中心,北京100081)
摘要:数值模式直接输出和经模式后处理得到的预报误差比较,是延伸期逐日要素预报应用基础。针
对中国2583个站点在2020年春季11~30天的日最高温度预报,根据欧洲数值中心的集合预报输出,首先,使用BP-SM (Back-Propagation -Self memory )法和回归法,进行确定性预报订正效果比较;结果表明BP-SM 法和回归法都明显降低了预报绝对误差;在11~14天预报中,BP-SM 法得到的平均绝对误差为3.3~3.6ºC ,预报准确率超过35%,订正效果更优。其次,基于模式直接输出和BP-SM 法获得的概率预报,使用CRPSS (continuous ranked probability skill score)进行了可预报性分析。结果表明,在地形复杂地区,经过订正,预报准确率明显改善。对于延伸期逐日要素预报,合理的模式后处理方法是降低预报误差和提高预报能力的重要环节。
词:模式后处理过程;延伸期;集合预报;神经网络
中图分类号:P457.3
文献标志码:A
Doi :10.16032/j.issn.1004-4965.2020.071
收稿日期:2020-05-24;修订日期:2020-09-16基金项目:国家气象中心预报员专项(Y201928)资助
通讯作者:熊敏诠,男,江西省人,博士,主要从事月内尺度气象要素预测。E-mail:*********************
1引言
在全球变暖的背景下,持续异常性天气气候事件频发,我国幅员辽阔且地域差异极大,若能尽早做出精准天气预报,将在气象预报服务中发挥更大作用;因此,高质量的延伸期要素预报显得尤为重要。
在诸多要素预报中,2米温度和人们日常生产、生活密切相关,社会关注度高;数值模式预测方面,1~10天短中期预报已有较高的准确率;但是,11~30天的延伸期预报精度低,由于其介于中短期和短期气候预测之间,Lorenz [1-2]指出了两周的可预报性理论上限;因而,如何提高延伸期预报能力始终是气象预报理论研究和实际业务中的难点问题。
结题报告
尽管延伸期被誉为“预报荒漠”[3]
,但仍有可预
报的分量,根据数值模式输出,使用低频分析是延
伸期预报的主要方法;但是,该方法多用于要素距
平场预报,难以应用到逐日预报中;特别是近地面气象要素,受复杂的下垫面属性和中小尺度扰动影响大,数值模式预报误差明显。面对上述情况,往往采用模式后处理方法来降低原始预报误差,一般有参数化方法和非参数化方法。在历史数值预报产品和观测资料有限的情况下,则使用参数化方法;其中MOS (Model Output Statistics )方法[4-5]、
NGR
(Nonhomogeneous
Gaussian
Regression )方法[6]、神经网络方法是三种较有代表性的手段。非参数化方法是基于丰富的样本,推测出预报和实况可能的非线性关系;Schaake shuffle 方法[7]和ensemble copula coupling 方法[8],根据集合预报中各成员不同排序方式更精确地描述区域内预报的空间相关[9-10]。神经网络方法是数值后处理过程中重要的非线性订正方法[11-12];在预报误差呈现非线性特征时,普通的统计回归方法容易出现过拟合现象,但是神经网络方法对训
热带气象学报第36卷
练数据有良好的记忆功能,能较好地克服泛化性问题。自从后向算法的提出[13],相比传统建模方法,神经网络方法更为有效[14]。由于无需先验假设条件和优良的非线性拟合能力[15],在气象预测领域得到广泛的应用[16]:温度预报[17-18]、云分类[19],强对流预测[20]、大风预报[21]、降水量预报[22-24]、风暴路径预测[25]、雷达资料质量控制[26-27]等。
中国气象局正式印发的《全面推进气象现代化行动计划(2018—2020年)》提出有能力对外发布延伸期(11~30天)的大气预测产品。目前,我国已建成了无缝隙精细化气象预报系统,延伸期预报从要素的平均态和距平值进行趋势性预测,向更为精细的逐候、逐日预报方向发展。很多数值预报中心都实时发布延伸期要素预报:中国国家气候中心业务运行“次季节-季节”集合数值模式的预报时效延伸到未来两个月,欧洲中期天气预报中心(ECMWF)每周两次发布未来1~46天的集合(51个成员)预报模式输出,美国国家海洋和大气管理局每日业务产品有1~45天的集合(16个成员)预报。基于集合预报产品的误差订正,代刊等[29]总结了近些年主要的订正方法;智协飞等[30-31]通过集合成员和超级集合产品,使用多种方法改进降水预报和10~15d温度预报;程文聪等[32]采用深度学习方法进行降水量的降尺度分析;熊敏诠的“神经网络-自忆”法[33-34],特别是在较长时效的预报中,对温度预报误差订正能力突出,同时,开展了对不同的数值优化方法、网络结构,计算收敛性、预报误差比较分析。总体来看,基于集合预报系统产品,针对国内复杂的天气、气候和下垫面属性,如何提高延伸期要素预报能力需要深入分析。
为适应社会经济的发展对延伸期要素预报的需求,国家气象中心和部分省级气象台的延伸期逐日要素预报产品研发已在稳步推进和试验运行,有必要评估其可预报性和预报误差变化特点,也是深入挖掘延伸期数值模式输出的有效信息,并服务于社会公众的基础性工作。因此,针对延伸期日最高温度预报误差特点,将从以下几个方面进行探讨:第一,介绍所采用的资料和方法,基于欧洲数值中心集合预报产品,分别使用“神经网络-自忆”法和回归法,进行延伸期(11~30d)逐日的日最高温度确定性预报误差分析和订正;第二,开展概率预报检验,分析预报误差时空分布特点,比较了分区域的预报技巧。最后,讨论了订正前、订正后的日最高温度的预报能力变化。
2资料和方法
2.1资料
欧洲数值中心的未来11~30天预报产品(表1),可从1~15天的中长期预报、16~46天月预报中提取,中长期预报是逐日发布,而月预报则是一周两次。在实际应用中,由于接收资料时间的滞后性:对于11~14天预报,使用原始数值产品预报的时效要往后推一天,如第11天的预报,采用的原始中长期产品是第12天预报;在15~30天预报中,由于起报时间的差异,使用的月预报产品都要往后推迟36小时。以下的分析中,都是依据调整后的预报时效展开,起报时间为20时(北京时,下同)。
表1ECMWF集合预报产品概况
产品名称中长期预报月预报
预报要素
定时温度
6小时最高温度
吴郭鱼
成员数
51
51
预报时效
1~15天
16~46天
时间间隔
12小时
6小时
空间分辨率
0.5º×0.5º
0.5º×0.5º
发布频次
逐日
一周两次(星期一、星期三)
起报时间
20时
中国同学录546008时
以日最高温度为例,模式直接输出(direct model output,DMO)取值如下:11~14天预报中,先计算每个时效(12小时间隔)的集合平均,然后,从预报日内3个时效的集合均值中,挑出最大值作为DMO;15~30天,先根据每日4个时段的6小时最高温度,得到每个时效的集合平均,4个时效中
的最大值作为DMO。模式后处理过程中,逐候建模,其中的训练集是根据2017、2018、2019年同期(起报日)的前后各1个月的样本(共计6个月)。预报集是2020年3月1日—2020年5月31日的数值产品,进行订正前、订正后的预报误差分析。
根据中国2583个站点,将数值模式的格点场
796
第6期熊敏诠等:春季中国日最高气温延伸期预报误差分析及订正
数据,通过反距离权重法插值得到站点预报,使用历史和实时的模式产品和实况数据,进行建模、预报检验和分析。按照区站号(50~59区),可细划为十个分区,其站数依次为111、104、96、313、403、57、302、544、410、243,具体分布如图1所示。
55°N
50°N
45°N
40°N
35°N
30°N
25°N
20°N
15°N
图1中国区域站点分布
2.2方法
数值模式预报误差分为系统偏差和非系统偏差,统计方法是系统偏差订正的有力工具,而系统偏差随着大气运动时空演变而变化,往往有着非线性变化特点,因此,单一的线性模型很难刻画出误差变化特点。BP神经网络是人工智能重要的组成部分,由于其较强的非线性拟合能力,且无需列出预报对象
的先验分布,而广泛应用于气象预报中。
神经网络建模过程中需要考虑模型的泛化性,一方面是训练过程中容易陷入局部极小,另一方面是大气运动本身的复杂性和数值模式的不完美。BP神经网络-自忆(Back-Propagation Neural Network-Self Memory,简称BP-SM)建模方法能较好地解决上述问题(图2)。SM方法的思路是将自相关函数用于模式误差分析中,由于预报误差普遍有一阶或二阶记忆特征,可使用自回归动态建模,通过历史数据对未来进行预测。
y
t=φy t-1+εt(1)y
t为t时刻的预报误差,φ是自回归系数,εt是白噪声。t时刻的估值y t的表达式y t=φy t-1,代入
式(1)递归迭代,可以得到式(2):
慕容鲜卑
y
t≈φt+1y-1+φt y0+φt-1y1+⋯⋯+φy t-1(2)令L t=β0y0+β1y1+β2y2+⋯⋯+βτyτ(3)
{}βiτ
i=0≈
{}φt-iτi=0,存在有限大的L t,满足y t<
L
t
,其中,τ是邻近样本数,此处τ值统一设置为15;例如在2020年3月1日制作未来第11天预报,此时,最新的实况截止到3月1日,那么邻近样本选取日起于2020年2月3日,止于2月18日的第11天历史预报误差。采用指数衰减方程,t′=τ-t,计算t′时刻的式(3)的误差系数,
β
i=
exp(-τ-iτ)
∑i=1τexp(-iτ),i=0,1,2,.....,τ,愈邻近当前时
间的样本序列号愈大,将y i分成正负值两个序列,由式(3)进行误差区间估计[E down,E up],误差
上界
E
up
和下界E
down
作文 黑板上的记忆建模具体步骤:第一得到51个成员的6个统
计特征量,有集合平均(mean)、最低(min)、最高
(max)、三分位值(q1、q2、q3),分位选取25%、50%
和75%;第二是生成相应的训练集;第三是建立6-
50区51区52区53区54区55区56区57区58区59区
80°E90°E100°E110°E120°E130°E
797
热带气象学报第36卷
15-1的三层网络模型,以六个统计量作为输入层,输出层是预报误差估计(d t),随机生成权值场,使用自适应调整参数法迭代获得最终的网络模型;第四是使用Self-memory方法,修正BP方法的预报误差估计(d t),再加上实时的集合均值,得到订正后的日最高温度预报(T
max
)。
图2BP-SM方法的示意图
回归法是模式后处理过程中主要的建模途径之一,将使用多元回归(公式(4))法(以下简称回归法)进行预报误差订正。
Y=γ0+γ1x1+γ2x2+γ3x3+γ4x4+γ5x5+γ6x6
(4)为了和神经网络输入层保持一致,多元回归中的预报因子也为相同的6项,x1,⋯⋯,x6分别对应集合均值、最低、最高、三分位值,γ0,⋯⋯,γ6是
回归系数,Y为预报量,即日最高温度(T
max
)。
3预报检验
概率预报是描述延伸期气象要素变化不确定性的主要手段,确定性预报(单一值预报)属于概率预报的特例;以2020年春季每天12时发布的延伸期日最高温度预报为例,对比了原始集合预报和经过订正后的确定性预报;同时,在正态分布假设基础上,构建概率预报,分析了预报技巧的变化。
3.1确定性预报检验
11~14天的预报:绝对误差(图3a),DMO都大于6℃,主要是因为所用的集合预报产品是12小时间隔的定时温度,经过建模订正后,都降低到3.5℃左右;随着预报时效的延长,两种方法对应的预报误差都呈缓慢增长的特点,例如BP-SM法从3.3℃(第11天)增加到3.6℃(第14天)。预报准确率(图
3b),DMO只有15%,订正后的准确率得到大幅提升,都超过了35%;同样,准确率也是随时效的延长而降低。方法比较中,BP-SM法略优于回归法。在这个时段,虽然使用的资料原始误差大,但是,订正后的预报能力都趋于正常,表明模式后处理技术对系统误差有较强的订正能力。
预报准确率可以反映一定误差范围内的预报能力,如某站,共n次预报,当误差在-2~2℃范围
内出现了m次,那么,预报准确率为
m
n
×100%。
预报准确率比较中(图3b),11~14天,BP-SM法略优(39%~37%),回归法是36%~34%;15~21天,BP-SM法有微弱的优势;22~30天,两者接近。相较于绝对误差,BP-SM法得到的15~30天预报准确率近似于回归法,其可能原因:在高原和地形复杂地区,DMO的误差通常较大,而BP-SM法的订正能力偏强(图4),2583个站点求平均后,就有更低的绝对误差(图3a);当在一定误差范围内比较时,特别是在15天以后的预报,已经超过了两周理论上限,DMO的非系统偏差为主导,大部分站点的非系统偏差部分可能已超过2℃误差范围,统计方法的订正能力有限,此时,两种方法得到的
预报准确率相近。
可得到以下特点:第一,对不同时间分辨率的DMO,两个方法都能表现出较强的订正能力,虽然11~14天、15~30天两个时段使用的DMO产品的时间分辨率不同,订正后的预报误差并没有
mean max
min q1 q2 q3d t T
max
Self-memory
798
第6期熊敏诠等:春季中国日最高气温延伸期预报误差分析及订正出现跳跃性变化;第二,BP-SM 法对系统偏差订正能力可能略好于回归法,但是,随着时效的延长,非系统偏差越来越重要,统计方法改善能力也随
之减弱;第三,在15天后,订正前、订正后的预报误差都趋于平缓,即饱和状态。
图3集合平均、BP-SM 法、回归法在2020年春季延伸期日最高温度预报绝对误差(a )和预报准确率(b )
(a)
(b)
在地形复杂地区、中东部高原和丘陵地区,DMO 绝对误差大多超过6℃(图4a~4f ),青藏高原东部和新疆的部分地区误差大于9℃。可能有三个原因:一是DMO 的网格场空间分辨率是50km ,代表性误差大;二是数值模式的地形场和实际情况有着较大差异;三是粗分辨率的网格预报无法刻画中小尺度的天气波动。订正后,上述地区的绝对误差基本降到4℃以下,在西藏南部的局部地区在2℃以下,说明BP-SM 法在DMO 预报误差大值区有着显著的订正能力。
在东部平原地区,DMO 绝对误差在3℃左右,数值模式表现出较强的预报能力。而模式后处理技术的订正效果总体偏弱。该区域可能以非系统偏差为主,而统计学方法往往只对系统偏差有效。
从预报准确率看(图4g~4l ):在地形复杂地区和高海拔地区,DMO 大多在20%以下,订正后,能提高到50%~60%。中东部平原地区的DMO 预报准确率达到40%,而订正后的改进效果较弱。3.2概率预报技巧的空间分布特点
概率预报是开展可预报性分析的依据。使用正态分布的温度概率预报模型,将单值预报转换成概率预报;具体过程是经过模式后处理技术获得的温度值作为概率密度函数(probability density function,PDF )的期望值,集合预报的离散度转换为PDF 的标准差。根据1988—2017年逐日的日最高气温,计算出近30年的日最高气温的逐日气候PDF 。由此,有了三个PDF :一是原始集合预报的PDF ,即DMO 的PDF ;第二是BP-SM 法得到的PDF ;第三个是气候态的。
CRPSS 是连续变量概率预报检验的主用方法[35],常用于延伸期模式系统的可预报性分析[36-37],并在不同的技巧分值下,讨论数值模式的预报能力[38-39]。CRPSS DMO =1-CRPS DMO /CRPS CLIM ,CRPSS BP -SM =1-CRPS BP -SM /CRPS CLIM ,其中CRPS (continuous ranked probability score )用于检验集合预报的可靠性和分辨率,
CRPS DMO 、CRPS BP -SM 、CRPS CLIM 分别是DMO 、BP-SM 法和气候预报的CRPS 值,而CRPSS DMO 、CRPSS BP -SM 为DMO 、BP-
SM 方法得到的概率预报相对于气候预报的技巧评分,数值为正表示正技巧,反之是负技巧。
为了便于观察正负值变化,设定-0.5~0.5区间,CRPSS 数值在边界值之外时,都归为邻近边界值标,图5中的CRPSS 都乘了100。DMO 产品:在11~14天,大多为负技巧,由于使用的原始资料是12小时间隔的定时预报,由此得到的日最高温度误差就比较大,这是得到的资料状况引起的;15~30
天,在中国的中西部、华南、北方的部分地区多为负技巧,只有在东部平原、川渝部分地区是正技巧。也就是说,中国区域,数值模式原始输出基本为负技巧。
BP-SM 法改进后,预报能力有了一定改善。在11~14天预报中(图5b ),大部地区的CRPSS 是正值,如新疆北部超过了0.2;负值区主要集中在青藏高原东部,而且数值都在-0.3以上,接近于零值。15~30天,相比于DMO ,正值区有所扩大,如新疆北部维持有较大范围的正技巧;负值区的数值也减弱了,如中西部DMO 负技巧大多低于-0.5,订正后的数值普遍在-0.3以上。
5.5
4.5
3.5M A E (℃)
11
16
21
26
Lead Time (days)
A c c u r a c y (%)
4035302520
1511
16
21
26
Lead Time (days)
BP-SM
Multiple Linear Regression DMO
BP-SM
Multiple Linear Regression DMO
799

本文发布于:2024-09-20 16:21:55,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/535979.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:预报   误差   数值
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议