一种基于深度学习的台风强度估测技术

第47卷第5期气象Vol.47No.5 2021年5月METEOROLOGICAL MONTHLY May2021
钱奇峰,王川,徐雅静,等,2021.—种基于深度学习的台风强度估测技术气象,47(5):601-608.Qian Q F,Wang C,XuYJ, et al,2021.A deep learning technique of typhoon intensity estimation"#Meteor Mon,47(5):601-608(in Chinese).
—种基于深度学习的台风强度估测技术!
钱奇峰1王川2徐雅静2周冠博1刘达1聂高臻1
1国家气象中心,北京100081
2北京邮电大学,北京100876
提要:台风客观定强是提高台风业务现代化水平的重要支撑技术,深度学习通过机器对大量样本的分析和学习,能够隐式提取图像中深层抽象的复杂特征,越来越多地被应用到气象领域中。本文利用ResNet深度学习模型,采用预训练后迁移学习的方式,以2005-2018年西北太平洋及南海台风的卫星云图为样本,构建了一种自动、客观的台风强度估测技术。通过对2019年全年的业务台风云图的检验分析,结果表明利用该技术能够实现对不同强度、不同发展阶段的台风客观强度估测,且对2019年全年独立样本估测的平均绝对误差和均方根误差分别为4.3m・s1和5.5m・s1,精度优于传统客观定强方法,具有一定的
业务应用价值。
关键词:深度学习,卫星云图,台风定强,ResNet网格
中图分类号:P456,P457文献标志码:A DOI:10.7519/j.issn.1000-0526.2021.05.008
A Deep Learning Technique of Typhoon Intensity Estimation
QIAN Qifeng WANG Chuan2XU Yajing2ZHOU Guanbo1LIU Da1NIE Gaozhen1
1National Meteorological Centre,Beijing100081
2Beijing Universty of Posts and Telecommunications,Beijing100876
Abstract:Typhoon objective strength determination is an important supporting technique to improve the modernization level of typhoon forecasting operation.Deep learning can implicitly extract the deep complex featuresintheimagesthroughthelearningofalargenumberofsamples,andithasbeenincreasinglyap-plied to the meteorological field nowadays.In this paper,a ResNet deep learning model is used to study the satellite cloud images as samples by pre-training and transfer-learning.After studying the2005—
2018 typhoon images of the Northwest Pacific and South China Sea,we consturct an automatic and objective ty-phoonin8ensi8yes8ima8ion8echnique.Byusing8hedeeplearning8echnique8oanalyze8he8yphoonsa8e l i8e imagesin2019,wefind8ha88his8echniquecanbeused8oes8ima8e8heobjec8ivein8ensi8yof8yphoonindif-feren8in8ensi8yanddi f eren8developings8ages,and8hemeanabsolu8eerror(MAE)androo8meansquare error(RMSE)of independent samples in2019are  4.3m•s—1and5.5m*s—1respectively.The accuracy isbe t erthanthatofthetraditionalobjectiveintensityestimationmethod,soithascertainapplicationval-ues$
Key words:deep learning,satellite image,typhoon intensity estimation,ResNet network
*广东省重点领域研发计划重点专项项目(019B111101002)和国家重点研发计划(2017YFC1501604)共同资助2020年7月4日收稿;2021年1月4日收修定稿
第一作者:钱奇峰,主要从事热带气旋的预报和研究•E-mail:qianqf@cma
602气象第47卷
引言
由于台风一般生成于开阔洋面,而海洋上观测资料稀少,特别是在台风进入雷达有效探测范围之前,台风的监测主要依靠气象卫星探测来完成’因此在台风业务预报实践中,卫星云图就成为了确定台风强度的最主要的依据,而如何通过卫星云图更准确地估测台风强度也就成为了尤为重要的课题’这方面,目前世界气象组织(World Meteoro­logical Organization,WMO)推荐使用的方法为20世纪7。年代美国国家海洋和大气管理局
Ocea/ic and Atmospheric Administration,HOAA)的Dvorak(1975)在统计经验的基础上建立的基于台风云型特征的台风强度估测技术。而经过多年业务实践,Dvorak方法也已成为各国官方机构最常使用的台风主观定强方法(许映龙等,2015)。Dvorak 方法的缺点是在云特征指数的确定方面存在较大主观性,准确率依赖预报员的经验和训练,因此国外一些学者提出了客观Dvorak方法,从而减少人工操作、提高自动化程度,如ODT(objective Dvorak technique;V elden et al,1998)和AODT(advanced objective Dvorak technique;Olander and Velden,2007)等方法,其中AODT一直在被不断改进并在国外进行业务应用。
我国早在20世纪80年代就开始探索利用卫星云图确定台风强度(方宗义和周连翔,1980;范蕙君等,1990),并制定了台风强度确定的技术流程,在业务中发挥了重要作用。2010年以后,中央气象台开始在业务中使用WMO推荐的Dvorak技术版本进行台风定强(许映龙等,2015),进一步提高了我国台风定强精度以及与其他业务中心的可比性。在客观定强方面,也有不少国内学者取得一定进展,如鲁
小琴等(2014)利用热带云团对流核的相关特征,建立了估测台风强度的方法,估算精度能与Dvorak方法接近。
近年来,随着人工智能学科的广泛应用,由于其在图像识别方面的优势,如何将深度学习技术应用于气象领域的台风定强研究,受到越来越多的关注。美国最先开展了相关研究工作。Pradhan et al (2018)使用基于多层深度CNN(convolutional neural network)对台风等级进行估计,仅使用遥感云图就取得了超过当时公认最好方法的准确率和均方根误差值(RMSE);在德国,Zahera et al(2019)使用LSTM (long short-term memory)和DNN(deep neural network)对台风强度进行估计,结合台风发生时的社会媒体信息,提升了对灾难性天气的强度估计。在台湾,Chen et al(2018)发布了一个开放数据集,提出了基于CNN强度回归的多模型融合方法,证明了深度学习技术在气象学研究中具有巨大的应用潜力。Tian et al(2019)使用分类和回归神经网络对台风强度进行更加精细的划分,证明了深度学习技术对热带气旋(TC)强度估计能力的提升。张淼等(2017)利用FY-3C微波温度计通道特征与台风强度建立统计关系估计热带气旋强度,并开展了尝试性的研究。越来越多的研究成果表明,运用深度学习技术解决台风定强问题具有巨大的应用前景(Combinido et al,2018;邹国良等,2019)。然而,由于这些工作多为针对大西洋或东太平洋飓风,使用的强度标签(真值)也都采用美国或日本发布的最佳路径。已有研究表明,采用不同机构的最佳路径作为实况参考会对台风强度误差评定结果产生较大的影响(陈国民等,2019)。因此本文将基于更匹配我国台风业务的中国气象局台风最佳路径集,采用目前
人工智能领域最新发展的ResNet深度学习模型,构建一种自动、客观的台风强度估测技术,以期为我国台风业务提供应用。
1深度学习模型简介2012nba中国赛
2015年He et al(2016)提出了ResNet,在计算机视觉(CV)领域的顶级赛事ImageNet比赛中获得第一名,之后CV领域的很多方法都建立在Res-Net的基础上完成,检测、分割、识别等领域都纷纷使用ResNet。ResNet深度网络的优势为允许原始输入信息直接传到后面的层中,将在一定程度上弥补传统的卷积网络或者全连接网络的缺陷,比如在信息传递的时候或多或少会存在信息丢失、信息损耗,随着深度增加导致梯度消失或者梯度爆炸等问题。具体解决的方法就是通过ResNet网络的残差结构(图1),直接将输入信息旁路传到输出,保护信息的完整性,整个网络只需要学习输入、输出差别的那一部分,简化学习目标和难度。
第5期钱奇峰等:一种基于深度学习的台风强度估测技术
603
图1 ResNet 的残差学习模块
Fig. 1 Residual  learning  module  of  ResNet
图1中:工表示输入,FQ )表示残差块在第二
层激活函数之前的输出,即FC x )=W 2!CW q ),其 中W 1和#2表示第一层和第二层的权重!表示修
正线性单元(rectified  linear  unit,ReLU )的激活函 数'最后残差块的输出是!^F(x ') +门。
迷惘的一代
由于ResNet 的这一优点,首先使用ResNet50 深度学习模型,在ImageNet(Deng  et  al,2009)数据
集上进行训练,使其具有识别物体的基本能力,然后 在最后两个卷积层进行迁移学习,这种做法被称为
预训练模型(Russakovsky  et  al, 2015; He  et  al ,
2019)。其中,模型最后一层卷积经过平均池化生成 2 048维的特征向量,代表了经过深度学习之后与台
风强度有关的云图特征,该特征向量再通过一个
softmax 分类器,按照1 m ・s -1的间隔输出预测强
人造美女郝璐璐
度及相应的概率(图2)。
2强度估测模型的构建
本文中所有试验均基于RedHat  EL  7. 6系统,
模型使用TensorFlow 深度学习框架,通过CUDA
与cuDNN 利用NVIDIA  Tesla  T4 GPU 加速模型
训练。采用的集成开发环境为Anaconda ,由Py ­
thon  语言编写而成。
2.1深度学习数据集准备
建模所用的资料包括2005—2018年西北太平 洋及南海台风卫星云图(http : # weather. is. koch-
u. ac.jp/sat/GAME),水平分辨率为0. 05°,根据中
国气象局《热带气旋年鉴》热带气旋最佳路径资料
(http : # tcdata. typhoon. org. cn/zjljsjj  _ zlhq. h --
ml),截取对应时刻台风中心400X400像素的云图
(约2 000 km  X  2 000 km ),并按照最佳路径台风强 度标注标签,共计15 730张台风云图,作为深度学
习数据样本集。
样本集数据的风速分布情况如图3所示,可以
2 500
一预测强度一刪
2 000
mH
1500
1000
外国文学研究500
5510
一25
112・
6710 12 13 14 15 16 17 18 20 21 22 2325 27 28 30 32 33 35 3840 42 43 4548 50 51 52 53 55 57 58 60 62 65 68 70 72
风速/(m  • s _1)
图3样本集中各风速的样本数目
Fig. 3 Number  of  samples  for  each  wind  speed  in  the  sample  set
49
6
64气象第47卷看到各个风速的分布并不是均匀的,其中以18、20、
23和25m-s—1等风速样本最多,而较小风速(<15 m*s—1%和较高风速(>65m*s—1%的样本数明显偏少。因此,本文使用了机器学习中较常用的数据增强技术(Pradhan et al,2018)进行一定程度的改善,即对云图采用台风图像进行90。、180。和270。的旋转处理,通过数据增强技术增加台风样本数量。另外,个别风速的样本即使经过数据增强后仍然较少,如21)2)7和32m•s—1等风速的样本,我们将其剔除出样本集,最终形成深度学习模型的数据集。
为了保证模型能对所有风速的台风云图特征进行学习,将每种风速均按7:3的比例分配形成深度学习模型训练集和测试集,其中训练集用来训练模型,测试集用来检验模型的学习效果。值得注意的是,旋转后的图像需和原始图像位于同一个图像集,即若原图像存在于训练集,那么由其旋转得到的图像也应存在于训练集。最终训练集共有12550个X4=50200个样本,测试集共有3138个X4= 12552个样本。
2.2模型训练流程
在ResNet深度学习网络的训练过程中,主要是通过更新网络中的每一个权重,使得最终的输出接近于真实标签值,即将整个网络的误差作为一个整体进行了最小化,从而使模型逐步拟合训练集。ResNet网络包含大量的参数,准备的训练数据集样本量对于有50层的ResNet深度学习网络建模而言是远远不够的,而在小数据集上训练会导致过度拟合,并极大地影响泛化能力。
因此,选择在预训练模型上进行迁移学习,即使用训练数据集提供给最后两个卷积层进行针对性学习,
从而大大提高样本的使用率,降低学习成本。训练流程为:先使用训练集的图像和对应的强度信息不断地调整预训练网络的权重,最终使得模型的输出与真实强度值间的差异最小。模型训练的难点在于台风强度相近的图像差别非常小,人眼难以辨别。而模型要通过学习相似图像间的微小差别来判定不同的类别,需要不断地更新模型的权重,多次微调和测试不同的模型参数。2.3建模检验指标
模型的精确度通过正确率检验,假设在"个样本中第z个样本的真值标签为O,,模型估测标签为S,,则模型分类的正确率可以表示为:
Accuracy=丄'1(S,=OJi(1)
i~1
式中表示当模型的输出和真实风速值完全一致时才被认为是准确的(例如真实风速值为48m•s—1,那么只有模型输出也是48m•s-1,被认为是该样本估测正确)图4给出了训练过程中训练集和测试集的准确率变化情况,其中蓝代表训练集上的准确率曲线,橙代表测试集上的准确率变化情况。可以看到,随着网络训练次数不断增加,训练集的正确率一直在提升并趋近于1(接近1代表模型过拟合),而测试集的正确率当训练次数达到300次以后就趋于稳定,达到58%左右。因此,将训练300次后的ResNet模型参数确定为训练完成的模型。
2.4建模测试结果分析
为了检验模型效果,这里利用训练完成的模型对测试集3138个原始云图样本(对比表明,旋转后的样本估测结果与原样本相同)的估测结果进行了分析。一般来讲,softmax分类器输出的最大概率对应的强度即为模型估测结果,但是也注意到模型输出除了第一猜值以外,还有其余可能值及相应概率。经过比较(表1),其中第一猜值(TOP】)的平均概率为75.3%,前两位猜值(TOP Z)累计平均概率为88.8%,TOP3的累计概率就达到了94.2%,其余分类值的概率占比已经很小,可以忽略不计。
这里使用模型输出结果进行了三组对比分析,如式(2)所示,U,为模型估测的第i个猜值风速,入为第i个猜值风速相应的概率。TOP】代表使用模型输出的第一猜值作为对测试样本的定强结果, TOP2代表使用前两位猜值按概率进行加权平均后的强度值作为定强结果,同理可算得TOP3的强度值,见式(2),结果如表1。可见,使用TOP3得到的样本估测强度的平均绝对误差(MAE)和RMSE分别为2.385m*s—1和  3.523m*s—1,相比于TOPi 和top2都较小,反映了更好的估测效果。
TOP i='(U,(i=1,2,3)(2)
第5期钱奇峰等:一种基于深度学习的台风强度估测技术
605
图4训练集与测试集的准确率曲线
Fig. 4 Accuracy  curves  of  training
set  and  test  set
表1 ResNet 模型输出结果TOP 】〜TOP3的
累计概率及其MAE 和RMSE 比较
Table  1 Cumulative  probability  of  ResNtt  model  outputs  from  TOPi  to  TOP 3 and  the  comparison  of  MAE  and  RMSE
估测结果累计概率/%MAE/(m  ・ s T)R2SE/(m  ・ s T)
TOP i 75. 3  2.402  3.946
TOP 288 8
2. 427
3. 614TOP 3
94. 2
2. 385
3. 523
3实时检验分析
由于期望模型最终能在业务上应用,但建模数 据与实际业务数据总是存在一定差异,而目前业务
使用的卫星数据有我国的FY4A 卫星和日本葵花
8号卫星,不同卫星的台风云图亮温值也存在微小
的差异。考虑到葵花8号卫星的范围较好覆盖了西 北太平洋所有的台风,因此这里准备了 2019年西
北太平洋及南海全年台风的云图(数据来源于业务 接收的葵花8号卫星%,经过挑选与最佳路径定强对
应时刻的云图,共计596个样本,包含了 2019年西 北太平洋和南海的29个台风。然后利用上文训练 好的深度学习模型对这些样本云图进行定强,用来
检验模型对实际业务中全新未知样本的估测能力,
以此评估其业务应用的前景。
3.1
2019年模型定强性能分析
这里将2019年的云图样本按照最佳路径定强 分成7〜17级以上共12个风速等级(表2),共包含
了 588个样本(另有8个6级的风速样本未包含), 其中8〜9级(热带风暴级)的样本数最多,之后随着 风速增长,样本数基本逐渐减少,这与图3给出的建
模样本的风速分布较为相似。
首先,从强度估计的最大、最小值和中位数来
看,随着台风实际风速的增长,这三个特征值也总体
计委大院
呈增长趋势,表明模型对不同强度的台风云图有一
定的识别能力,但从模型估测的最小至最大强度跨 度来看均较大,也表明模型估测中对一些样本存在 较大偏差,在实际应用中需要加以注意。进一步,从
中位数与各级风的风速范围比较来看,比如模型对
7级样本的估测值的中位数为8级(18. 5 m ・s K1 ),
说明对此类样本,模型强度估测略偏强;而模型对8
〜11级样本的估测则没有明显的偏差;对更高风级
的样本(12级及以上),模型估测结果略有偏弱。
其次,从各风级样本的MAE 和RMSE 来看,模 型对8〜9级的样本估测效果最好,其MAE 和RMSE
都是最小的,其中对8级样本MAE 为2.8 m ・s K1、
表2模型对2019年云图台风样本的强度估计分析
Table  2 Analysis  of  typhoon  intensity  estimation  of  cloud  images  in  2019
风级
风速范围/( m ・s K i )
样本数/个模型估测/( m ・s K 1)
样本数/丨
最小值
中位数心理预期
最大值
MAE
RMSE
7
13.9 〜17.168
15.218.526.1  4.2  4.8
817. 2〜20. 713215.219.9
37.9  2.8
4.1920.8〜24.4
74
16.222.233.9
3.3
4.110
24.5〜28.48418.228.0
42.1  4.6
5.61128.5〜32.64318.331.138.8  4.4  5.112
32.7〜36.95021.031.8
43.6
4.5
5.7
1337.0〜41.438
23.035.146.8  6.37.914
41.5 〜46.1
2827.9
39.649.1  5.67.0
1546.2〜50.932
29.244.252.9
6.28.01651.0〜56.0
2041.6
50.0
58.8  5.0
6.417
56.1 〜61.2
1050.955.159.6
3.6
4.4>17
> 61. 2
9
54.2
58.960.0
6.5
7.2
合计
588  4.3
5.5

本文发布于:2024-09-20 14:38:40,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/493898.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:台风   模型   强度
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议