基于神经网络的自主水下航行器模型预测路径跟踪方法

1.本发明涉及一种自主水下航行器路径跟踪方法，更具体地是一种基于神经网络的自主水下航行器模型预测路径跟踪方法。

背景技术：

2.自主水下航行器(autonomous underwater vehicles，auv)因其航程远、作业精准度高、可重复使用等特点，成为了人们认识和探索海洋领域必不可缺的工具，在近些年逐渐被广泛应用。水下回收技术极大地提高了auv续航能力，路径精确跟踪是实现水下回收的关键。
3.目前在路径跟踪控制领域应用较为广泛的算法有pid控制算法、滑模控制算法、最优控制算法等，但是这些算法对控制对象的参数和环境的依赖程度比较高，一旦外界稍有变化，便不能在新状态下很好地继续路径跟踪；此外，针对auv在运动过程中受到的运动学约束和执行机构的约束，上述算法也很难处理。模型预测控制是一种在诸多约束条件下取得最优解的算法，具有参数选择简单、处理约束能力强、可实现多目标优化和计算结果满足最优性等优点。另外，模型预测控制对未来路径的预测能力很突出，这也使得它逐渐成为研究热点。
4.auv模型具有多自由度、非线性，强耦合性的特点，且auv运动数学模型中的部分水动力附加质量、惯性矩和阻尼系数是难以精确确定的。另外，auv在航行过程中，经常会受到外界比如未知洋流的干扰等，使得auv路径跟踪又增添了不确定性。径向基(radial basis function，rbf)神经网络能快速逼近系统动力学模型，结构更简单，与其它神经网络算法相比，rbf神经网络在求解最优值问题上有一定的优势。

技术实现要素：

5.要解决的技术问题
6.为了避免现有技术的不足之处，本发明提出一种基于神经网络的自主水下航行器模型预测路径跟踪方法。
7.技术方案
8.一种基于神经网络的自主水下航行器模型预测路径跟踪方法，其特征在于步骤如下：
9.步骤1：建立auv模型，包括动力学方程式和运动学方程式；
10.所述的auv运动学方程式：
[0011][0012]
所述的auv动力学方程式：
[0013][0014]
其中，x表示前向位移、y表示侧向位移、ψ表示航向角、v
x
和vy分别为前向速度和侧向速度、r为auv的航向角速度， m
11
＝m
11
，m
22
＝m
22
，m
33
＝m
33
，d
11
＝d
11
，d
22
＝d
22
，d
33
＝d
33
，为附加质量的惯性矩阵m、阻尼矩阵d中的元素；n为操纵面产生的操纵力；
[0015]
步骤2：构建基于mpc的auv路径跟踪控制器；
[0016]
根据auv路径跟踪性能指标要求，采用mpc控制算法，步骤1中的auv模型为被控对象，在每个采样时刻k，获取auv最新的测量状态，根据auv跟踪状态误差最小和控制输入最小的要求，预测时域内的控制序列，最后选取求解得到的控制序列的第1个元素作为auv模型的输入量，这一时刻结束后在下一个采样时刻重新获取auv的状态，继续下一周期滚动优化；auv路径跟踪目标可以表示为以下滚动优化控制问题：
[0017][0018]
约束条件：
[0019]
x(k+1)＝f(xk,uk)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0020]
yk＝g(xk)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0021]umin
≤uk≤u
max
,k＝1,...,ncꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0022]
x0＝x(k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)
[0023]
式(5)中，r和q分别代表控制输出和控制输入的权重矩阵，n
p
表示预测范围，nc表示控制范围，yk是auv系统状态输出y＝[v
x x v
y y r ψ]
t
，v
x
和vy分别为前向速度和侧向速度；r(k)是期望指令，即要跟踪的参考状态；u为控制输入 u＝[x 0 n]
t
，即推进器产生的推力x以及操纵面产生的操纵力n；约束中的式(6) 和式(7)代表步骤1中的auv模型，xk＝[v
x v
y r]
t
表示3个状态；式(9)表示系统当前状态反馈；
[0024]
步骤3：采用rbf神经网络来进行逼近auv模型不确定项
[0025]
所述的rbf神经网络结构包括三个不同的层，设置输入层5个节点，隐藏层7个节点，输出层3个节点；rbf神经网络通过线性组合隐藏层来计算网络的预测输出y，即：
[0026][0027]
式中，h为高斯激活函数，w
jq
是第j个隐藏层节点到第q个输出层节点的权重向量，m表示隐藏层神经元的个数；
[0028]
rbf神经网络的输入层x＝[v
x v
y r x n]
t
，输出为auv模型的不确定项δf(xk,uk)，根据rbf神经网路输出表达式(10)，可得到auv模型不确定项为：
[0029]
δf(xk,uk)＝w
t
h(xk)+ε
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0030]
其中，w是隐藏层到输出层的权重矩阵，h是高斯激活函数h组成的向量，ε是偏差项
[0031]
步骤4：构建基于rbf-mpc的auv路径跟踪控制器；
[0032]
结合步骤1中的auv模型以及步骤3中rbf描述的auv模型不确定项，从而确定auv的真实模型；在真实模型的基础上，采用步骤2中的mpc控制器，根据 auv跟踪状态误差最小和控制输入最小的要求，构建目标函数，并结合约束条件优化求解预测时域内的控制序列；最后选取求解得到的控制序列的第1个元素作为系统的输入量；这一时刻结束后在下一个采样时刻重新获取auv的状态，继续下一周期滚动优化；令向量x表示auv的状态，u表示控制输入，则auv的状态更新方程可描述为：
[0033]
x
k+1
＝f(xk,uk)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0034]
则真实的auv模型f
true
(xk,uk)表示为：
[0035]
x
k+1
＝f
nom
(xk,uk)+δf(xk,uk)＝f
true
(xk,uk)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
[0036]
其中，δf(xk,uk)表示步骤3中采用rbf逼近的auv模型中的不确定项，f
nom
(xk,uk) 表示步骤1中的auv模型；
[0037]
因此将auv的路径跟踪控制问题描述为以下的带约束的动态优化问题：
[0038][0039]
约束条件：
[0040]
x
k+1
＝f
nom
(xk,uk)+δf(xk,uk)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
[0041]
e(k+1)＝x
k+1-x
ref
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)
[0042]umin
≤uk≤u
max
,k＝1,...,ncꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17)
[0043]
x0＝x(k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(18)
[0044]
式(14)中，r和q分别为路径跟踪状态偏差的权重矩阵和控制输入权重矩阵，式(15) 代表真实auv系统，xk＝[v
x v
y r]
t
表示3个状态，即v
x
和vy分别为前向速度和侧向速度、r为auv的航向角速度；式(16)表示实际状态与参考状态之间的偏差值；式(17) 代表求解优化问题时控制输入u＝[x 0 n]
t
的约束范围；式(18)表示auv当前状态反馈。
[0045]
auv路径跟踪控制过程中，模型预测控制器在auv进行路径跟踪时通传感器获得当前时刻的auv状态值；然后根据预测模型对auv在预测时域内的状态值进行预测，通过构建的目标函数式(14)并结合约束条件式(15)、式(16)和式(17)优化求解预测时域内的控制序列；最后选取求解得到的控制序列的第1个元素作为系统的输入量；这一时刻结束后在下一个采样时刻重新获取auv的状态，继续下一周期滚动优化。
[0046]
优选地：步骤3中m＝7。
[0047]
优选地：采用梯度下降法调整权重w
jq
。
[0048]
一种计算机系统，其特征在于包括：一个或多个处理器，计算机可读存储介质，用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现上述的方法。
[0049]
一种计算机可读存储介质，其特征在于存储有计算机可执行指令，所述指令在被执行时用于上述的方法。
[0050]
一种计算机程序，其特征在于包括计算机可执行指令，所述指令在被执行时用于实现上述的方法。
[0051]
有益效果
[0052]
本发明提出的一种基于神经网络的自主水下航行器模型预测路径跟踪方法，采用模型预测控制器(model prediction control，mpc)进行路径跟踪控制的基础上，利用实时测量数据在线训练rbf神经网络，对auv模型不确定性进行补偿，抑制了模型不确定性对模型预测控制器的干扰，减小了系统的超调量和跟踪误差。matlab 环境下仿真结果表明，基于rbf-mpc路径跟踪控制算法与经典的mpc算法相比，具有更好的暂态、稳态性能和更好的节能效果。
[0053]
与现有技术相比，具有以下有益效果：
[0054]
1.由于水下航行器系统的强非线性和强耦合性，导致auv实际上难以建立精确的系统模型，采用rbf神经网络对模型进行补偿，使得模型更加逼近auv真实模型；
[0055]
2.将rbf神经网络与mpc算法结合起来应用到auv路径跟踪控制算法中，抑制了模型不确定性对模型预测控制器的干扰，减小了系统的超调量和跟踪误差。与经典的mpc算法相比，具有更好的暂态、稳态性能和更好的节能效果。
附图说明
[0056]
附图仅用于示出具体实施例的目的，而并不认为是对本发明的限制，在整个附图中，相同的参考符号表示相同的部件。
[0057]
图1 auv模型；
[0058]
图2 rbf神经网络示意图；
[0059]
图3 rbf-mpc示意图；
[0060]
图4路径跟踪控制结果；
[0061]
图5 x方向跟踪偏差对比；
[0062]
图6 y方向跟踪偏差对比；
[0063]
图7控制输入力的变化曲线；
[0064]
图8控制输入力矩的变化曲线。
具体实施方式
[0065]
为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图和实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。此外，下面描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0066]
本发明的实现步骤如下：
[0067]
步骤1：针对本发明研究对象auv，建立其动力学和运动学模型；
[0068]
为了方便后续的研究分析，忽略欠驱动auv水平面运动和垂直面运动带来的耦合影响，忽略动力学模型中的非线性二次阻尼项，建立欠驱动auv水平面3自由度的动力学和运动方程。
[0069]
步骤2：构建基于mpc的auv路径跟踪控制器：根据auv路径跟踪性能指标要求，采用mpc控制算法。步骤1中的auv模型为研究对象，在每个采样时刻k，获取auv最新的测量状态，根据auv跟踪状态误差最小和控制输入最小的要求，预测时域内的控制序列，最后选取求解得到的控制序列的第1个元素作为auv模型的输入量，这一时刻结束后在下一个采样时刻重
新获取auv的状态，继续下一周期滚动优化。
[0070]
步骤3：采用rbf神经网络描述模型的不确定项：在实际的航行过程中，auv 的质量、水动力附加质量、惯性矩和阻尼系数等通常随工作条件(包括任务和环境) 的变化而变化。除此之外，水下航行器系统的强非线性和强耦合性，导致难以建立精确的auv模型，从而影响了其路径跟踪的性能。因此针对模型不确定项，采用rbf 神经网络来进行逼近。rbf神经网络部分为5-7-3的形式，即输入层的节点有5个，隐藏层节点为7个，输出层节点3个，输出则为auv的模型不确定项δf(xk,uk)。
[0071]
步骤4：构建基于rbf-mpc的auv路径跟踪控制器：结合步骤1中的auv名义模型以及步骤3中rbf描述的模型不确定项，从而确定auv的真实模型。在真实模型的基础上，采用步骤2中的mpc控制器，根据auv跟踪状态误差最小和控制输入最小的要求，构建目标函数，并结合约束条件优化求解预测时域内的控制序列；最后选取求解得到的控制序列的第1个元素作为系统的输入量。这一时刻结束后在下一个采样时刻重新获取auv的状态，继续下一周期滚动优化。
[0072]
步骤1中通常使用两个坐标系来描述auv的运动：地面坐标系和运载体坐标系。地面坐标系的原点o为固定在地球上一处，规定ox向东为正，oy向北为正。运载体坐标系的原点ob选择在auv的浮心，规定obxb沿着auv的纵轴并指向艏向，obyb与之垂直，向右为正。如图1所示，用x表示前向位移、y表示侧向位移、ψ表示航向角、 v
x
和vy分别为前向速度和侧向速度、r为auv的航向角速度，定义广义坐标向量η＝[x y ψ]
t
，广义速度向量v＝[v
x v
y r]
t
，以此得到auv在水平面上的运动方程为：
[0073][0074][0075]
式中，m为含附加质量的惯性矩阵，c(v)为哥氏力和向心力矩阵，d(v)为阻尼矩阵，τ是在三个自由度上产生的力和力矩，在本发明中研究欠驱动，所以它代表推进器产生的推力以及操纵面产生的操纵力。
[0076]
假设auv的前后、左右分别对称，则有：
[0077][0078][0079][0080]
[0081]
τ＝[x y n]
t
＝[x 0 n]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0082]
由此可得，欠驱动auv在水平面上的运动学方程和动力学方程，分别表示为：
[0083][0084]
和
[0085][0086]
式中，m
11
＝m
11
,m
22
＝m
22
,m
33
＝m
33
,d
11
＝d
11
,d
22
＝d
22
,d
33
＝d
33
，为附加质量的惯性矩阵m，阻尼矩阵d中的部分元素。
[0087]
步骤2中auv路径跟踪目标可以表示为以下滚动优化控制问题：
[0088][0089]
约束条件：
[0090]
x(k+1)＝f(xk,uk)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0091]
yk＝g(xk)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0092]umin
≤uk≤u
max
,k＝1,...,ncꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
[0093]
x0＝x(k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
[0094]
式(10)中，r和q分别代表控制输出和控制输入的权重矩阵，n
p
表示预测范围，nc表示控制范围，yk是auv系统状态输出[v
x x v
y y r ψ]
t
，v
x
和vy分别为前向速度和侧向速度、r为auv的航向角速度，x表示前向位移、y表示侧向位移、ψ表示航向角；r(k)是期望指令，即要跟踪的参考状态；约束中的式(11)和式(12)代表系统预测模型，xk＝[v
x v
y r]
t
表示3个状态，约束式(13)为控制量的输入u＝[x 0 n]
t
的幅值，即推进器产生的推力x以及操纵面产生的操纵力n；式(14)表示系统当前状态反馈。
[0095]
步骤3中rbf网络结构如图2所示，该结构包括三个不同的层，其中n是输入层节点的个数，m是隐藏层节点的个数，l是隐藏层节点的个数。针对本发明，设置输入层5个节点，即n＝5，隐藏层7个节点，即m＝7，输出层3个节点，即l＝3。
[0096]
高斯函数在rbf神经网络中作为激活函数的应用十分广泛，作为最常用的基函数，正是由于它是通过输入层和隐藏层中心点之间的距离选择权重，使得它的计算精度会更高，能更有效地对模型进行逼近，在本发明中的rbf神经网络应用中，对隐藏层hj的计算方式为：
[0097]
[0098]
式中，||x-cj||表示x和cj之间的欧几里得距离，rbf神经网络采用中心(cj)和宽度 (σj)为参数的高斯基函数。
[0099]
中心值cj为第j个隐藏层神经节点的高斯基函数中心点矢量值：
[0100]cj
＝[c
1j
…cnj
]
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)
[0101]
宽度σj代表隐藏层的高斯基函数宽度，σj＝[σ1,σ2,
…
,σ
l
]
t
是一个正数，影响着神经网络映射范围，σ值越大，表示高斯基函数越宽，说明网络对输入的映射能力越强。
[0102]
所述的rbf网络结构图如图3所示，rbf通过线性组合隐藏层来计算网络的预测输出y，即：
[0103][0104]
式中，h为高斯激活函数，w
jq
是第j个隐藏层节点到第q个输出层节点的权重向量，本发明采用梯度下降法调整权重w
jq
。
[0105]
具体到本发明中，rbf神经网络部分为5-7-3的形式，即输入层的节点有5个，输入层x＝[v
x v
y r x n]
t
，隐藏层节点为7个，输出层节点3个，输出为auv的模型不确定项δf(xk,uk)。
[0106]
根据rbf神经网路输出表达式(17)，可得到auv模型不确定项为：
[0107]
δf(xk,uk)＝w
t
h(xk)+ε
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(18)
[0108]
式中，w是隐藏层到输出层的权重矩阵，h是高斯激活函数h组成的向量，即 h＝[h
1 h2…hm
]
t
，ε是偏差项。
[0109]
rbf神经网络的参数学习速率η＝0.10，动量因子α＝0.05，基宽参数b＝50，中心向量取值：
[0110][0111]
权重矩阵：
[0112][0113]
步骤4：构建基于rbf-mpc的auv路径跟踪控制器：令向量x表示auv的状态，u表示控制输入，则auv的状态更新方程可描述为：
[0114]
x
k+1
＝f(xk,uk)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(21)
[0115]
δf(xk,uk)表示步骤3中采用rbf逼近的auv模型中的不确定项，f
nom
(xk,uk)表示步
骤1中的auv名义模型，则真实的auv模型f
true
(xk,uk)表示为：
[0116]
x
k+1
＝f
nom
(xk,uk)+δf(xk,uk)＝f
true
(xk,uk)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(22)
[0117]
因此可以将auv的路径跟踪控制问题描述为以下的带约束的动态优化问题：
[0118][0119]
约束条件：
[0120]
x
k+1
＝f
nom
(xk,uk)+δf(xk,uk)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(24)
[0121]
e(k+1)＝x
k+1-x
ref
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(25)
[0122]umin
≤uk≤u
max
,k＝1,...,ncꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(26)
[0123]
x0＝x(k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(27)
[0124]
式(23)中，r和q分别为路径跟踪状态偏差的权重矩阵和控制输入权重矩阵，式(24) 代表真实auv系统，xk＝[v
x v
y r]
t
表示3个状态，即v
x
和vy分别为前向速度和侧向速度、r为auv的航向角速度；式(25)表示实际状态与参考状态之间的偏差值；式 (26)代表求解优化问题时控制输入u＝[x 0 n]
t
的约束范围；式(27)表示auv当前状态反馈。
[0125]
auv路径跟踪控制过程中，模型预测控制器在auv进行路径跟踪时通传感器获得当前时刻的auv状态值；然后根据预测模型对auv在预测时域内的状态值进行预测，通过构建的目标函数式(23)并结合约束条件式(24)、式(25)和式(26)优化求解预测时域内的控制序列；最后选取求解得到的控制序列的第1个元素作为系统的输入量。这一时刻结束后在下一个采样时刻重新获取auv的状态，继续下一周期滚动优化。
[0126]
基于上述理论，在matlab仿真环境下，给定参考路径，分别采用经典mpc控制方法和rbf-mpc控制方法，通过观察在两种控制器下auv的各项状态参数，对比两种方法对参考路径的跟踪效果。采用remus auv模型，实际上auv的质量是 30.5kg，在仿真实验中将控制器中auv的质量设置为23.5kg。将auv的初始位置为(10m,-10m)，依次到达目标点位置为(17m,-56m)，(187m,-146m)，(208m,-234m)， (334m,414m)，(488m,-488m)，(980m,-980m)，初始航向角0，控制器的采样间隔t＝0.1，预测步长n＝50，仿真时间360s。
[0127]
由图4中可以看出，两种控制器都能较好的完成跟踪任务，从局部放大图可以看出，两种控制器都能产生平滑的运动轨迹，但是在转向点处，二者的差异非常明显。不论是在横坐标为30-80m的第一次的拐角路径跟踪段，还是在横坐标为350-400m的第二次拐角处路径跟踪段，rbf-mpc控制器都比mpc控制器具有更小的超调量，能更快速地减少与期望的参考路径之间误差，具有更好的跟踪性能。
[0128]
为进一步清晰看出mpc控制器和rbf-mpc控制器的跟踪效果差异，将横纵向位置的跟踪偏差以及航向角偏差结果展示在图5、图6。mpc控制器在x方向的位置偏差最高可达21.5m，而rbf-mpc控制器可以将误差减少到11.9m，误差减少将近50％；在y方向的位置误差上rbf-mpc控制器的效果也很显著，特别是在第18s到第75s 之间；同样，航向角的偏差在峰值处体现比较明显。因此，可以看出模型不确定性使 mpc控制器存在较大的稳态误差，加入神经网络补偿后，超调量明显减少，更快达到稳定状态。图8展示了使用两种控制器时，auv的控制输入力和力矩的变化曲线。从变化趋势上来看，两种控制器基本保持一致，但是mpc控制器产生的波动更明显。由以上结果表明，由于mpc控制器对水下航行器模型进行了简化，建模误差较大，因此路径跟踪控制误差也较大，相比于未使用rbf神经网络进行模型逼
近训练的mpc 控制器，本发明所设计的rbf-mpc控制器有更好的跟踪效果。
[0129]
由此可以得出结论，在存在建模误差或显著不确定性的情况下，rbf-mpc控制器能提供比一般的mpc控制器更好的性能，在进行神经网络模型的识别后，控制系统的性能得到显著提升。
[0130]
图7和图8中展示了使用mpc控制器和rbf-mpc控制器时，控制输入力和力矩的变化。从变化趋势上来看，rbf-mpc控制器产生的输入波动更小，特别在10s、59s 以及66s峰值处差异较为明显，且在稳态阶段，rbf-mpc控制器得到的控制输入比较平稳，所耗能量更少，更利于auv长时间水下作业。
[0131]
综上所述，在存在模型不确定和扰动的情况下，rbf-mpc在控制效果方面具有更小的路径跟踪超调量和更小的稳态误差；在控制输入方面，具有更小输入幅值，更加节能。与传统的mpc控制器相比，综合优势明显。
[0132]
以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明公开的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。

技术特征：

1.一种基于神经网络的自主水下航行器模型预测路径跟踪方法，其特征在于步骤如下：步骤1：建立auv模型，包括动力学方程式和运动学方程式；所述的auv运动学方程式：所述的auv动力学方程式：其中，x表示前向位移、y表示侧向位移、ψ表示航向角、v
x
和v
y
分别为前向速度和侧向速度、r为auv的航向角速度，m
11
＝m
11
，m
22
＝m
22
，m
33
＝m
33
，d
11
＝d
11
，d
22
＝d
22
，d
33
＝d
33
，为附加质量的惯性矩阵m、阻尼矩阵d中的元素；n为操纵面产生的操纵力；步骤2：构建基于mpc的auv路径跟踪控制器；根据auv路径跟踪性能指标要求，采用mpc控制算法，步骤1中的auv模型为被控对象，在每个采样时刻k，获取auv最新的测量状态，根据auv跟踪状态误差最小和控制输入最小的要求，预测时域内的控制序列，最后选取求解得到的控制序列的第1个元素作为auv模型的输入量，这一时刻结束后在下一个采样时刻重新获取auv的状态，继续下一周期滚动优化；auv路径跟踪目标可以表示为以下滚动优化控制问题：约束条件：x(k+1)＝f(x
k
,u
k
)
ꢀꢀꢀꢀꢀꢀꢀ
(6)y
k
＝g(x
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)u
min
≤u
k
≤u
max
,k＝1,...,n
c
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)x0＝x(k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)式(5)中，r和q分别代表控制输出和控制输入的权重矩阵，n
p
表示预测范围，n
c
表示控制范围，y
k
是auv系统状态输出y＝[v
x x v
y y r ψ]
t
，v
x
和v
y
分别为前向速度和侧向速度；r(k)是期望指令，即要跟踪的参考状态；u为控制输入u＝[x 0 n]
t
，即推进器产生的推力x以及操纵面产生的操纵力n；约束中的式(6)和式(7)代表步骤1中的auv模型，x
k
＝[v
x v
y r]
t
表示3个状态；式(9)表示系统当前状态反馈；步骤3：采用rbf神经网络来进行逼近auv模型不确定项所述的rbf神经网络结构包括三个不同的层，设置输入层5个节点，隐藏层7个节点，输
出层3个节点；rbf神经网络通过线性组合隐藏层来计算网络的预测输出y，即：式中，h为高斯激活函数，w
jq
是第j个隐藏层节点到第q个输出层节点的权重向量，m表示隐藏层神经元的个数；rbf神经网络的输入层x＝[v
x v
y r x n]
t
，输出为auv模型的不确定项δf(x
k
,u
k
)，根据rbf神经网路输出表达式(10)，可得到auv模型不确定项为：δf(x
k
,u
k
)＝w
t
h(x
k
)+ε
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)其中，w是隐藏层到输出层的权重矩阵，h是高斯激活函数h组成的向量，ε是偏差项步骤4：构建基于rbf-mpc的auv路径跟踪控制器；结合步骤1中的auv模型以及步骤3中rbf描述的auv模型不确定项，从而确定auv的真实模型；在真实模型的基础上，采用步骤2中的mpc控制器，根据auv跟踪状态误差最小和控制输入最小的要求，构建目标函数，并结合约束条件优化求解预测时域内的控制序列；最后选取求解得到的控制序列的第1个元素作为系统的输入量；这一时刻结束后在下一个采样时刻重新获取auv的状态，继续下一周期滚动优化；令向量x表示auv的状态，u表示控制输入，则auv的状态更新方程可描述为：x
k+1
＝f(x
k
,u
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)则真实的auv模型f
true
(x
k
,u
k
)表示为：x
k+1
＝f
nom
(x
k
,u
k
)+δf(x
k
,u
k
)＝f
true
(x
k
,u
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)其中，δf(x
k
,u
k
)表示步骤3中采用rbf逼近的auv模型中的不确定项，f
nom
(x
k
,u
k
)表示步骤1中的auv模型；因此将auv的路径跟踪控制问题描述为以下的带约束的动态优化问题：约束条件：x
k+1
＝f
nom
(x
k
,u
k
)+δf(x
k
,u
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)e(k+1)＝x
k+1-x
ref
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)u
min
≤u
k
≤u
max
,k＝1,...,n
c
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17)x0＝x(k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(18)式(14)中，r和q分别为路径跟踪状态偏差的权重矩阵和控制输入权重矩阵，式(15)代表真实auv系统，x
k
＝[v
x v
y r]
t
表示3个状态，即v
x
和v
y
分别为前向速度和侧向速度、r为auv的航向角速度；式(16)表示实际状态与参考状态之间的偏差值；式(17)代表求解优化问题时控制输入u＝[x 0 n]
t
的约束范围；式(18)表示auv当前状态反馈。auv路径跟踪控制过程中，模型预测控制器在auv进行路径跟踪时通传感器获得当前时刻的auv状态值；然后根据预测模型对auv在预测时域内的状态值进行预测，通过构建的目标函数式(14)并结合约束条件式(15)、式(16)和式(17)优化求解预测时域内的控制序列；最后选取求解得到的控制序列的第1个元素作为系统的输入量；这一时刻结束后在下一个采样时刻重新获取auv的状态，继续下一周期滚动优化。2.根据权利要求1所述的基于神经网络的自主水下航行器模型预测路径跟踪方法，其
特征在于步骤3中m＝7。3.根据权利要求1所述的基于神经网络的自主水下航行器模型预测路径跟踪方法，其特征在于采用梯度下降法调整权重w
jq
。4.一种计算机系统，其特征在于包括：一个或多个处理器，计算机可读存储介质，用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现权利要求1所述的方法。5.一种计算机可读存储介质，其特征在于存储有计算机可执行指令，所述指令在被执行时用于实现权利要求1所述的方法。6.一种计算机程序，其特征在于包括计算机可执行指令，所述指令在被执行时用于实现权利要求1所述的方法。

技术总结

本发明涉及一种基于神经网络的自主水下航行器模型预测路径跟踪方法，采用模型预测控制器MPC进行路径跟踪控制的基础上，利用实时测量数据在线训练RBF神经网络，对AUV模型不确定性进行补偿，抑制了模型不确定性对模型预测控制器的干扰，减小了系统的超调量和跟踪误差。MATLAB环境下仿真结果表明，基于RBF-MPC路径跟踪控制算法与经典的MPC算法相比，具有更好的暂态、稳态性能和更好的节能效果。稳态性能和更好的节能效果。稳态性能和更好的节能效果。