一种基于事件触发的动力定位船舶H


一种基于事件触发的动力定位船舶h

最优控制方法
技术领域
1.本发明属于船舶运动控制领域,涉及一种基于事件触发的动力定位船舶h

最优控制方法。


背景技术:



2.随着人们对海洋资源不断地勘探与开发,船舶动力定位技术得到了迅速发展。面对复杂多变的海洋环境,对海上作业船舶的效率、安全性、自动化程度提出了更高的技术要求。近年来,关于动力定位船舶的研究主要存在两个问题:第一,在传统网络控制系统中,控制信号连续不断地从控制器传输到执行器,不仅增加了计算负担而且会产生不必要的信道占用。第二,船舶控制问题中稳定性、控制性能以及鲁棒性等是其主要关心的问题,目前对船舶鲁棒控制研究大部分都是以忽略模型之间相互耦合影响为前提的,作为解决实际鲁棒控制问题的有效手段之一,非线性h

控制因其复杂的hji(hamilton-jacobi-isaacs)不等式求解而受限,这给实际应用带来较大的难度。
3.专利cn111381595a《基于事件触发的船舶动力定位方法》中:在事件触发控制系统的研究上存在不足,系统的自适应参数选取偏小,稳定性证明上并不完善,全回转推进器的方位角变化不合理。论文《考虑事件触发输入的船舶自适应动力定位控制》自适应参数取值过小,6个参数选取过于接近,且未关注推进器存在固有的非线性动力学,如死区、饱和、滞后等。
4.基于上述分析,本发明提出了一种基于事件触发的动力定位船舶h

最优控制方法。利用事件触发的控制策略和时间触发的干扰策略,降低信号传递次数,仅当不满足触发条件时才更新事件触发的控制器,减少设备与控制器之间的通信,提供最小采样时间的正下界,以避免事件触发系统在有限时间内触发次数无穷大,即zeno行为。同时,将h

最优控制问题化为二人零和差分博弈,避免非线性h

控制设计中复杂的hji不等式求解过程,便于实际应用。


技术实现要素:



5.本发明的目的是提出一种基于事件触发的动力定位船舶h

最优控制方法,解决hji不等式求解过于复杂的问题,而且避免了计算负担,不会产生不必要的信道占用。
6.为实现上述目的,本发明采用如下设计方案。具体步骤如下:
7.步骤1:
8.建立动力定位船舶的动力学模型:假设动力定位船舶沿大地坐标系的x轴,以小于预设阈值的速度匀速航行,则动力学模型表示为矩阵形式如下:
9.[0010][0011][0012]
式中,m是包含附加质量的惯性矩阵,ν=(u,v,r)
t
表示动力定位船舶在船舶附体坐标下的纵荡速度u,横荡速度v,和艏摇角速度r构成的向量,τ为控制输入矢量,即推进器推力,其中τu,τv,τr分别为前进控制力,横移控制力和艏摇控制力距,m是船舶的质量,d为水阻尼系数矩阵,为船舶在纵荡,横荡,艏摇方向上的附加质量和艏向附加转动惯量系数,xu,yv,yr,nv,nr为船舶三个方向上的线性阻尼值,iz表示船舶的转动惯量,xg表示船体重心位于x方向的坐标,b(t)表示包括波浪,风,洋流在内的扰动矢量。
[0013]
对于船舶动力定位系统,当艏摇角很小时,有
[0014]
r(ψ)≈i
ꢀꢀꢀ
(4)式中,r(ψ)表示大地坐标系下船舶附体坐标系变换的旋转矩阵设u=τ,动力定位船舶状态空间模型可表示为
[0015][0016]
式中,x(t)∈rn是状态向量,a∈rn×n是系统矩阵,u(t)∈rm是控制输入向量,b=g(t)∈rn×m,e=k(t)∈rn×q是光滑函数矩阵,ω(t)∈rq表示由未建模的动力学风、洋流和二阶波浪漂移引起的慢变环境干扰,这些干扰都包含在偏差项内。
[0017]
步骤2
[0018]
引入一个采样数据系统其特征是事件触发瞬间序列单调递增,λj是第j次连续采样瞬间且λj<λ
j+1
。采样数据系统的输出是一系列采样状态。采样数据系统的输出是一系列采样状态所提出的控制方案中,控制器在事件触发时刻t∈[λj,λ
j+1
]更新,假设采样数据系统的任务延迟为零,定义当前状态x(t)和采样状态之间的事件触发误差为
[0019][0020]
步骤3
[0021]
在事件触发控制机制中,触发条件由事件触发错误和状态相关阈值决定,在t=λj触发条件不满足时,则触发一个事件。然后,对系统状态进行采样,将事件触发误差ej(t)重置为0,t=λj时,控制器基于新采样状态更新,使用零阶保持器后,获得的控制序列变为连续输入信号对于动力定位船舶模型,基于事件触发的自适应模型为
[0022][0023]
步骤4
[0024]
构建一个事件触发控制率υ(t),使得动力定位系统(3)渐近稳定,且l2增益小于等
于γ,即
[0025][0026]
式中,γ是规定的正常数,q和r为对称的正定矩阵;
[0027]
步骤5
[0028]
在时间触发的情况下,值函数定义为
[0029][0030]
非线性bellman方程为
[0031][0032]
式中,表示偏导数算子,将h

最优控制问题公式化为二人零和差分博弈,控制输入是一个最小化的参与者,干扰是一个最大化的参与者。此时,有唯一解(u
*

*
),u
*
和ω
*
是最优控制和最坏情况干扰,相应的hji方程为
[0033][0034]
步骤6
[0035]
根据值函数(9),bellman方程(10)的解是反馈控制和干扰策略的最优值函数v
*
(t),最优控制和最坏情况下的干扰策略为
[0036][0037][0038]
步骤7
[0039]
在事件触发条件下,基于采样状态信息而不是实际状态x(t)更新控制输入,式(12)可以写为
[0040][0041]
式中,通过事件触发控制率(10),hji方程(7)在每个触发瞬间t=λj为
[0042][0043]
步骤8
[0044]
在采样时刻更新事件触发控制策略,基于神经网络的值函数可以写为
[0045][0046]
式中,wc∈rn,φ(t)∈rn是临界神经网络的理想权重和激活函数向量,n是隐藏神经元的数量,ε∈r是临界神经网络近似误差,式(16)对t求导为
[0047][0048]
设为临界神经网络wc的未知理想权重估计,临界神经网络的实际输出可以表示为
[0049][0050]
步骤9
[0051]
时间触发扰动策略(13)和事件触发控制策略(14)可以近似为
[0052][0053][0054]
式中,是触发时刻λj处,基于事件触发条件下的理想权重估计值,动力定位船舶系统方程可以被重新写为
[0055][0056]
近似的哈密顿函数为
[0057][0058]
式中,e是残差方程误差,基于并行学习技术,临界神经网络权重可以由记录数据和当前数据同时更新,将时间tk的残差方程误差定义为
[0059][0060]
式中,r(tk)是对应于临界神经网络权重的记录数据。
[0061]
步骤10
[0062]
选择以最小化相应的平方残差e=(1/2)e
t
e,定义考虑到并行学习,临界神经网络一种新的权重调整律为
[0063][0064]
式中,σ表示存储数据点的索引,α>0表示学习率,σk为时间tk∈[λj,λ
j+1
),k∈[1,2,...p],j∈n的存储数据,p是存储的样本数,临界网络和干扰策略是根据时间驱动策略更新的,而控制策略是根据事件触发机制更新的。
[0065]
本发明具有如下有益效果:
[0066]
1.本发明为动力定位船舶提供了一种基于事件触发的h

最优控制方法,利用事件触发的控制策略和时间触发的干扰策略,降低信号传递次数,仅当不满足触发条件时才更新事件触发的控制器,在事件触发策略控制条件下,较时间触发机制采样减少了82.1%,从而大大减少设备与控制器之间的通信。
[0067]
2.本发明所述方法与专利cn111381595a相比,具有更快的收敛速度和更优越的稳定性能。其中,超调量不超过5%,纵荡和横荡位移调节时间减少了62%,艏摇角度调节时间减少了36.7%。
[0068]
3.本发明给出临界神经网络一种新的权重调整律,使控制输入有界。避免了非线性h

控制设计中复杂的hji不等式求解过程,减少了计算负担,在实际工程应用中,也不会产生不必要的信道占用。
附图说明
[0069]
图1为基于事件触发的动力定位船舶h

最优控制结构图;
[0070]
图2为时间触发机制与事件触发机制通信时间对比图;
[0071]
图3为动力定位船事件触发机制下控制输入τu,τv,τr对比图;
[0072]
图4为动力定位船事件触发机制下姿态变量x,y,ψ对比图;
[0073]
图5为动力定位船事件触发机制下施加干扰前系统状态响图;
[0074]
图6为动力定位船事件触发机制下施加干扰后系统状态响图。
具体实施方式
[0075]
下面结合附图对本发明做进一步描述。
[0076]
建立动力定位船舶的三自由度运动学模型为:
[0077][0078]
式中,η=(x,y,ψ)
t
表示动力定位船舶在大地坐标系下的位置信息(x,y)和艏向角度信息ψ构成的向量,x和y分别表示动力定位船舶在大地坐标系下的横坐标和纵坐标,ν=
(u,v,r)
t
表示动力定位船舶在船舶附体坐标下的纵荡速度u,横荡速度v,和艏摇角速度r构成的向量,r(ψ)表示大地坐标系下船舶附体坐标系变换的旋转矩阵。
[0079]
建立动力定位船舶的动力学模型的具体步骤包括:假设动力定位船舶沿大地坐标系的x轴,以小于预设阈值的速度匀速航行,则动力学模型表示为矩阵形式如下:
[0080][0081][0082][0083]
式中,m是包含附加质量的惯性矩阵,τ=[τ
u τ
v τr]
t
∈r3为控制输入矢量,即推进器推力,其中τu,τv,τr分别为前进控制力,横移控制力和艏摇控制力距,m是船舶的质量,d为水阻尼系数矩阵,为船舶在纵荡,横荡,艏摇方向上的附加质量和艏向附加转动惯量系数,xu,yv,yr,nv,nr为船舶三个方向上的线性阻尼值,iz表示船舶的转动惯量,xg表示船体重心位于x方向的坐标,b(t)表示包括波浪,风,洋流在内的扰动矢量。
[0084]
对于船舶动力定位系统,当艏摇角很小时,有
[0085]
r(ψ)≈i
ꢀꢀꢀ
(5)
[0086]
设u=τ,动力定位船舶状态空间模型可表示为
[0087][0088]
式中,x(t)∈rn是状态向量,a∈rn×n是系统矩阵,u(t)∈rm是控制输入向量,b=g(t)∈rn×m,e=k(t)∈rn×q是光滑函数矩阵,ω(t)∈rq表示由未建模的动力学风、洋流和二阶波浪漂移引起的慢变环境干扰,这些干扰都包含在偏差项内。
[0089]
引入一个采样数据系统其特征是事件触发瞬间序列单调递增,λj是第j次连续采样瞬间且λj<λ
j+1
。采样数据系统的输出是一系列采样状态所提出的控制方案中,控制器在事件触发时刻t∈[λj,λ
j+1
]更新。假设采样数据系统的任务延迟为零,定义当前状态x(t)和采样状态之间的事件触发误差为
[0090][0091]
在事件触发控制机制中,触发条件由事件触发错误和状态相关阈值决定。
[0092]
在t=λj触发条件不满足时,则触发一个事件。然后,对系统状态进行采样,将事件触发误差ej(t)重置为0,t=λj时,控制器基于新采样状态更新。使用零阶保持器后,获得的控制序列变为连续输入信号
[0093]
对于动力定位船舶模型,基于事件触发的自适应模型为
[0094][0095]
构建一个事件触发控制率υ(t),使得动力定位系统(8)渐近稳定,并且l2增益小于等于γ,即
[0096][0097]
式中,γ是规定的正常数,q和r为对称的正定矩阵。
[0098]
在时间触发的情况下,系统值函数定义为
[0099][0100]
相应的非线性bellman方程为
[0101][0102]
式中,表示偏导数算子。将h

最优控制问题公式化为二人零和差分博弈,控制输入是一个最小化的参与者,干扰是一个最大化的参与者。此时,有唯一解(u
*

*
),u
*
和ω
*
是最优控制和最坏情况干扰。为了促进时间触发机制的实施,定义时间触发h

问题的哈密顿量为
[0103][0104]
此时,相关的hji方程为
[0105][0106]
根据值函数(10),bellman方程(11)的解是反馈控制和干扰策略的最优值函数v
*
(t)。此时,最优控制和最坏情况下的干扰策略为
[0107][0108][0109]
基于式(14)和(15),hji方程时间触发情况可以改写为
[0110][0111]
在事件触发条件下,基于采样状态信息而不是实际状态x(t)更新控制输入。因此,式(14)可以写为
[0112]
[0113]
式中,通过事件触发控制率(17),hji方程(13)在每个触发瞬间t=λj为
[0114][0115]
基于并行学习技术,设计一种新的批判性神经网络权值调整规则。然后相应地更新时间触发扰动策略,在采样时刻更新事件触发控制策略。通过使用零阶保持器,将控制序列转换为c-t控制信号。基于神经网络的值函数可以写为:
[0116][0117]
式中,wc∈rn,φ(t)∈rn是临界神经网络的理想权重和激活函数向量,n是隐藏神经元的数量。ε∈r是临界神经网络近似误差,式(19)对t求导为
[0118][0119]
考虑事件触发控制策略υ(tj)和时间触发扰动策略ω(t),贝尔曼方程为
[0120][0121]
式中,剩余误差为
[0122][0123]
在动力定位船舶系统动力学的lipschitz假设下,残差是局部有界的。随着隐藏神经元数量的增加,该误差一致收敛到零。因此,存在ε
h max
>0,||εh||≤ε
h max
。设为临界神经网络wc的未知理想权重估计,临界神经网络的实际输出可以表示为
[0124][0125]
因此,时间触发扰动策略(15)和事件触发控制策略(17)可以近似为
[0126][0127][0128]
式中,是触发时刻λj处,基于事件触发条件下的理想权重估计值。动力定位船舶系统方程(6)可以被重新写为
[0129]
[0130]
近似的哈密顿函数为
[0131][0132]
式中,e是残差方程误差。基于并行学习技术,临界神经网络权重可以由记录数据和当前数据同时更新。将时间tk的残差方程误差定义为
[0133][0134]
式中,r(tk)是对应于临界神经网络权重的记录数据,σk为时间tk∈[λj,λ
j+1
),k∈[1,2,...p],j∈n的存储数据,p是存储的样本数。
[0135]
为了得到e的最小值,选择以最小化相应的平方残差e=(1/2)e
t
e,定义考虑到并行学习,临界神经网络一种新的权重调整律为
[0136][0137]
式中,σ表示存储数据点的索引,α>0表示学习率,临界网络和干扰策略是根据时间驱动策略更新的,而控制策略是根据事件触发机制更新的。通过定义关键神经网络的权重估计误差为取时间导数
[0138][0139]
定义扩展状态,对t进行求导后,得到式(31)
[0140][0141]
对于t=λj+1,动力定位船舶的动力学方程为
[0142][0143]
通过matlab软件对本发明方法进行仿真,仿真采用挪威科技大学海洋控制论实验室供应船1:70比例的cybership ii数据,参数表1为cybership ii相关参数设置
[0144]
表1 cybership ii相关参数设置
[0145][0146]
仿真对象动力定位船的惯性矩阵m,水阻尼系数矩阵d分别为:
[0147][0148][0149]
模拟中充分考虑了波浪、风、洋流等外部扰动。波浪方向和有效高度分别为150
°
和5.5m。水流方向和速度分别为100
°
和0.25m/s。风向和风速分别为225
°
和10m/s。船舶的初始位置和朝向为ηi=(0m 0m 0
°
),船体固定速度vi=(2m-2m 0.4
°
/s)。最终期望状态ηf=[10 10 4
°
],vf(0m/s 0m/s 0
°
/s)。
[0150]
图2显示了通信时间的比较,对于时间触发机制,在每个采样瞬间,记录位置和航向测量值,相同采样时间180s情况下,时间触发机制采用了1800个状态样本,而事件触发机制只采用了322个状态样本,由此可以看出,事件触发采样下,动力定位船和控制器之间需要的传输更少。
[0151]
图3显示了本发明控制方法与现有控制方法下,控制输入τu,τv,τr对比图。控制输入τu,τv,τr有界,且收敛性明显优于对比方法。
[0152]
图4为姿态变量x,y,ψ对比图,与现有控制方法相比,本发明所提方法具有更好的收敛性和更优越的稳定性,当仿真时间达到95s时,模型船达到期望状态,超调量不超过5%,纵荡和横荡位移调节时间较现有控制方法相比,减少了62%,艏摇角度ψ调节时间减少了36.7%。
[0153]
图5为系统施加干扰前后状态量对比图,在未施加干扰前,模型船系统是渐近稳定
的,在加入干扰向量ω(t)后,前15s内状态轨迹受到影响,在15s后干扰向量ω(t)趋于0,系统渐近稳定。
[0154]
最后应说明的是:以上所述具体实施方案,对本发明的发明目的、技术方案和有益效果进行了进一步说明,以上实施例仅用于说明本发明的技术方案,而非对本发明创造保护范围的限制,本领域的普通技术人员应当理解,凡在本发明的技术方案进行修改、等同替换,均包含在本发明的保护范围内。

技术特征:


1.一种基于事件触发的动力定位船舶h

最优控制方法,其特征在于,包括以下步骤:步骤1动力定位船舶状态空间模型表示为式中,x(t)∈r
n
是状态向量,a∈r
n
×
n
是系统矩阵,u(t)∈r
m
是控制输入向量,b=g(t)∈r
n
×
m
,e=k(t)∈r
n
×
q
是光滑函数矩阵,ω(t)∈r
q
表示由未建模的动力学风、洋流和二阶波浪漂移引起的慢变环境干扰,这些干扰都包含在偏差项内;步骤2引入一个采样数据系统其特征是事件触发瞬间序列单调递增,λ
j
是第j次连续采样瞬间且λ
j
<λ
j+1
,采样数据系统的输出是一系列采样状态采样数据系统的输出是一系列采样状态所提出的控制方案中,控制器在事件触发时刻t∈[λ
j

j+1
]更新,假设采样数据系统的任务延迟为零,定义当前状态x(t)和采样状态之间的事件触发误差为步骤3在t=λ
j
触发条件不满足时,则触发一个事件,然后,对系统状态进行采样,将事件触发误差e
j
(t)重置为0,t=λ
j
时,控制器基于新采样状态更新,使用零阶保持器后,获得的控制序列变为连续输入信号对于动力定位船舶模型,基于事件触发的自适应模型为步骤4构建一个事件触发控制率υ(t),使得动力定位系统(3)渐近稳定,且l2增益小于等于γ,即式中,γ是规定的正常数,q和r为对称的正定矩阵;步骤5在时间触发情况下,值函数定义为非线性bellman方程为式中,表示偏导数算子,将h

最优控制问题公式化为二人零和差分博弈,控制输入是
一个最小化的参与者,干扰是一个最大化的参与者,此时,有唯一解(u
*

*
),u
*
和ω
*
是最优控制和最坏情况干扰,相应的hji方程为步骤6根据值函数(5),bellman方程(6)的解是反馈控制和干扰策略的最优值函数v
*
(t),最优控制和最坏情况下的干扰策略为控制和最坏情况下的干扰策略为步骤7在事件触发条件下,基于采样状态信息更新控制输入,式(8)可以写为式中,通过事件触发控制率(10),hji方程(7)在每个触发瞬间t=λ
j
为步骤8近似的哈密顿函数为式中,e是残差方程误差,为临界神经网络w
c
的未知理想权重估计,是触发时刻λ
j
处,基于事件触发条件下的理想权重估计值,基于并行学习技术,临界神经网络权重可以由记录数据和当前数据同时更新,将时间t
k
的残差方程误差定义为式中,r(t
k
)是对应于临界神经网络权重的记录数据;
步骤9选择以最小化相应的平方残差e=(1/2)e
t
e,定义临界神经网络一种新的权重调整律为式中,σ表示存储数据点的索引,α>0表示学习率,σ
k
为时间t
k
∈[λ
j

j+1
),k∈[1,2,...p],j∈n的存储数据,p是存储的样本数,临界网络和干扰策略是根据时间驱动策略更新的,而控制策略是根据事件触发机制更新的。

技术总结


本发明涉及一种基于事件触发的动力定位船舶H


技术研发人员:

栾添添 谭政纲 孙明晓 李鸣阳 王海滨 刘彩云 王璐璐

受保护的技术使用者:

哈尔滨理工大学

技术研发日:

2022.11.15

技术公布日:

2023/2/23

本文发布于:2024-09-23 02:24:23,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/58834.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:事件   船舶   动力   神经网络
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议