基于深度学习模型的海表面高度数值预报偏差订正方法[发明专利]

(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202210248883.2
(22)申请日 2022.03.14
(71)申请人 中国人民解放军国防科技大学
地址 410073 湖南省长沙市开福区德雅路
109号
(72)发明人 朱俊星 汪祥 李留珂 张卫民 
陈祥国 王辉赞 陈妍 
(74)专利代理机构 长沙大珂知识产权代理事务
所(普通合伙) 43236
专利代理师 伍志祥
(51)Int.Cl.
G06K  9/62(2022.01)
G06N  3/04(2006.01)
(54)发明名称
基于深度学习模型的海表面高度数值预报
偏差订正方法
(57)摘要
本发明公开了基于深度学习模型的海表面
高度数值预报偏差订正方法,数据预处理,建立
数值预报数据与观测数据间的映射;构建SSH时
特征编码模型;构建SSH多层特征融合订正模
型;训练模型并根据测试集结果进行调参;根据
测试集评价模型订正效果。本发明通过SSH时序
特征编码模型提取SSH非常规分布特征,结合多
源要素特征进行时序性特征编码,利用多层特征
融合订正模型将时序性特征编码与时空特征编
码、订正前SSH相结合,拟合预报与真值之间复杂
的非线性关系,拟合精度更高;增加了SSH时序特
征编码模型对区域边界的关注度,提高了区域边
界的订正效果。权利要求书2页  说明书9页  附图2页CN 114611608 A 2022.06.10
C N  114611608
A
1.基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,包括以下步骤:
步骤一:数据预处理,建立数值预报数据与观测数据间的映射;
步骤二:构建SSH时序特征编码模型;
步骤三:构建SSH多层特征融合订正模型;
步骤四:训练模型并根据测试集结果进行调参;
步骤五:根据测试集评价模型订正效果。
2.如权利要求1所述的基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,所述步骤一中,为保证订正后数据的真实性,使用反距离插值方式将数值预报数据插值到观测数据上;为保证模型训练集和测试集属于同一分布,模型在预处理时针对每一变量进行标准化处理。
3.如权利要求1所述的基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,所述SSH时序特征编码模型包括多源要素特征和SSH非常规分布特征两部分;
SSH非常规分布特征的计算针对单个时间步进行,将多源要素特征序列利用主成分分析降维后再重构新的SSH特征序列,以此过滤得到SSH特征序列在多要素空间维度下的常规分布信息,然后计算原始SSH特征序列与重构的SSH特征序列之差ResX t ,从而最终得到SSH 非常规分布特征序列;多源要素特征序列在进行降维前进行去均值化:
其中,
为每个特征的均值,X t [i]为t时刻第i个格网点的特征向量;
X ’t 的协方差矩阵为采用特征值分解法,covX t 分解为covX t =Q∑Q ‑1其中,
是covX t 的特征向量组成的特征矩阵,∑为一个对角阵,对角线上的元
素为特征值;
选择最大的K个特征值对应的特征矩阵重构数据,则原数据与重构数据之
间的残差为:ResX t =X ′t ‑X ′t Q K Q K T ,
其中ResX t 残差部分中对应海平面高度的分量ResX t (SSH)作为SSH非常规分布特征,用于提高模型对边缘部分的订正效果,与多源要素特征共同构成LSTM输入X t :
X t =[X t ,ResX t (SSH)]
采用LSTM模块对变量进行编码,提取变量间时序相关的特征信息,选择最后时间步的隐藏状态h t 作为SSH时序特征编码模型的特征编码结果,使用遗忘门f t 、输入门i t 、输出门o t 分别控制单元接受、保存、输出的状态值,以实现信息的有选择性记忆和忘记;在t时刻,单个单元计算公式如下:
f t =σ(W f [h t ‑1,x t ]+b f )
i t =σ(W i [h t ‑1,x t ]+b i )
o t =σ(W o [h t ‑1,x t ]+b o )
h t =o t *tanh(C t )其中,为t时间步的候选细胞状态,C t 为t时间步的保留细胞状态,h t 为t时间步的隐藏状态,W f ,b f ,W i ,b i ,W o ,b o ,W C ,b C 均为模型可训练参数,梯度下降时自动更新。
4.如权利要求1所述的基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,所述步骤三多层特征融合订正模型中,除步骤二得到的时序特征编码h t 外,还添加了时空坐标特征编码coorX t 和订正前的海平面高度X t (SSH);其中,时空坐标特征编码包括待订正点对应的时间信息以及待订正点的经纬度,使模型订正过程中考虑了季节性和空间分布特征;添加订正前的海平面高度作为订正模型变量之一构建不受时序特征编码模型影响的捷径链接,避免模型梯度传播困难,提高拟合能力;
模型使用两层全连接网络拟合与真实观测数据间的非线性关系,隐藏层后添加的激活函数为ReLU激活函数,即:
Y t =W 2(ReLU(W 1[h t ,coorX t ,X t (SSH)]+b 1))+b 2
其中W 1、b 1为隐藏层参数,W 2、b 2为输出层参数,均为模型可训练参数。
5.如权利要求1所述的基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,所述步骤四中,SSH非常规分布特征提取模块将主成分维数、LSTM模块时间步长及节点数、多层特征融合订正模型隐藏层节点数作为模型调参变量之一,根据模型测试结果进行选择。
6.如权利要求1所述的基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,所述步骤五中,采用均方根误差、平均绝对误差、R方三种评价指标对该模型的偏差订正效果进行度量。
7.如权利要求1所述的基于深度学习模型的海表面高度数值预报偏差订正方法,其特征在于,使用海洋上层部分深度的温度、盐度、海水流速预报数据作为海表面高度偏差订正的辅助数据构成多源要素特征。
基于深度学习模型的海表面高度数值预报偏差订正方法
技术领域
[0001]本发明属于海洋数值预报模型中海平面高度预报产品的平差订正技术领域,尤其涉及基于深度学习模型的海表面高度数值预报偏差订正方法。
背景技术
[0002]海平面高度作为反映海洋环境变化的重要海洋要素之一,可以揭示海水温度盐度变化与海洋渔业、海洋生物发展、国防军事建设密切相关,针对海平面高度预报的研究工作十分重要。
[0003]现在主流的海平面高度预报模型多基于海洋数值模式,即在一定的初值和边值条件下,基于经验正交函数分析方法等建立方程求解,拟合海洋物理场,描述海洋要素变化规律。常用的海洋数值模式有HYCOM模式、POM模式、FVCOM模式等。海洋数值预报模型以过去和当前时刻的海水状态为初始状态,考虑海洋及其边界所受的各类作用,基于某种海洋数值模式,数值求解海水运动方程组,结合观测及同化数据,预报未来海洋现象及状态。由于数值模式并不能完全描述海洋的复杂物理过程,利用有限个离散点的值代替时空维度上连续的物理场这种离散的近似计算方式使得数值预报模型得预报结果与真实观测数据间存在一定的误差及系统偏差,因此在实际应用中还需要进行偏差订正,以提高预报精度。[0004]传统的数值预报偏差订正方法,如模式输出统计(model output statistic, MOS)、贝叶斯模式平均(Bayesian Model Averaging,BMA)等,利用样本信息采用线性回归建立统计关系,对数值预报结果进行平差,而海洋要素系统中存在的关系大多是复杂的非线性关系,并不能被线性回归捕捉。基于此,许多学者尝试使用机器学习方法,如随机森林、神经网络、LSTM等,无需考虑变量间的物理机制,采用纯数据驱动的方式拟合预报值与观测值之间的复杂非线性关系,被证实订正效果优于传统数值预报偏差订正方法。其中LSTM模型及其变体模型ConvLSTM、ST‑LSTM等,由于其优越的时序关系捕捉能力,在气象及海洋要素的预报及偏差订正上应用较为广泛。但是由于海平面高度在不
同时间会出现大片偏高区域和大片偏低区域,区域内部变化不大,但区域边界变化明显,因此区域边界处的预报结果与真实数据往往存在明显误差,LSTM对这种边界并不敏感,导致整体误差增大。
发明内容
[0005]有鉴于此,本发明提出了基于深度学习模型的海表面高度数值预报偏差订正方法用于数值预报模式下海平面高度产品的偏差订正。
[0006]本发明公开的基于深度学习模型的海表面高度数值预报偏差订正方法,包括以下步骤:
[0007]步骤一:数据预处理,建立数值预报数据与观测数据间的映射;
[0008]步骤二:构建SSH时序特征编码模型;
[0009]步骤三:构建SSH多层特征融合订正模型;
[0010]步骤四:训练模型并根据测试集结果进行调参;
[0011]步骤五:根据测试集评价模型订正效果。
[0012]进一步的,所述步骤一中,为保证订正后数据的真实性,使用反距离插值方式将数值预报数据
插值到观测数据上;为保证模型训练集和测试集属于同一分布,模型在预处理时需针对每一变量进行标准化处理。
[0013]进一步的,所述SSH时序特征编码模型包括多源要素特征和SSH非常规分布特征两部分;
[0014]SSH非常规分布特征提取模块的计算针对单个时间步进行,将温度、盐度、海水流速等多源要素特征序列利用主成分分析降维后再重构新的SSH特征序列,以此过滤得到SSH 特征序列在多要素空间维度下的常规分布信息,然后计算原始SSH特征序列与重构的SSH特征序列之差ResX t ,从而最终得到SSH非常规分布特征序列;
[0015]多源要素特征序列在进行降维前需要进行去均值化:
[0016]
[0017]其中,为每个特征的均值,X t [i]为t时刻第i个格网点的特征向量;
[0018]
X ’t 的协方差矩阵为[0019]
采用特征值分解法,covX t 可分解为cov  X t =Q∑Q ‑1[0020]其中,是covX t 的特征向量组成的特征矩阵,∑为一个对角阵,对角线
上的元素为特征值;
[0021]选择最大的K个特征值对应的特征矩阵
重构数据,则原数据与重构数据之间的残差为:Re  sX t =X 't ‑X 't Q K Q K T ,
[0022]其中ResX t 残差部分中对应海平面高度的分量ResX t
(SSH)作为SSH非常规分布特征,用于提高模型对边缘部分的订正效果,与多源要素特征共同构成LSTM输入X t :
[0023]X t =[X t
,Re  sX t (SSH)][0024]采用LSTM模块对变量进行编码,提取变量间时序相关的特征信息,选择最后时间步的隐藏状态h t 作为SSH时序特征编码模型的特征编码结果,使用遗忘门f t 、输入门i t 、输出门o t 分别控制单元接受、保存、输出的状态值,以实现信息的有选择性记忆和忘记;在t时刻,单个单元计算公式如下:
[0025]f t =σ
(W f [h t ‑1,x t ]+b f )[0026]i t =σ
(W i [h t ‑1,x t ]+b i )
[0027]
[0028]
[0029]
o t =σ(W o [h t ‑1,x t ]+b o )[0030]
h t =o t *tanh(C t )[0031]其中,为t时间步的候选细胞状态,C t 为t时间步的保留细胞状态,h t 为t时间步的隐藏状态,W f ,b f ,W i ,b i ,W o ,b o ,W C ,b C 均为模型可训练参数,梯度下降时自动更新。

本文发布于:2024-09-20 13:47:52,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/750087.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:特征   模型   订正   预报   数值   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议