轨道车辆及其运行优化控制方法、系统、存储介质与流程



1.本发明涉及轨道交通技术领域,特别是一种轨道车辆及其运行优化控制方法、系统、存储介质。


背景技术:



2.轨道车辆形成过程中引起的振动会严重影响乘客的舒适性,随着乘客期望舒适水平的提高,轨道车辆行驶的舒适性、安全性、时效性愈加重要。传统机械式解决方案无法很好地避免轨道粗糙度引起的振动和冲击,同时也无法平衡轨道车辆行驶的舒适性与时效性,导致乘客体验较差。为了增强轨道车辆运行的舒适性与时效性,需要一种可以主动进行自主决策的方法,优化轨道车辆运行参数。
3.发明专利申请cn114580290a公开了一种能耗和舒适度联合优化的高速列车组协同控制方法及系统,获取高速列车的实时运行信息,计算高速列车的实际速度与期望速度的速度偏差,考虑高速列车在运行过程中的能耗和乘坐舒适性均作为优化目标,基于高速列车的速度偏差及动力学关系,建立高速列车组多列车协同控制的多目标优化模型,通过带有精英保留策略的快速非支配排序算法求解多目标优化模型,得到每台高速列车的控制变量,将控制变量作用于动力装置,产生牵引力或制动力;将牵引力或制动力作用于高速列车,控制高速列车的速度变化,直至高速列车组以一致的状态运行。该方法考虑了列车运行过程中的运行速度和能耗,优化了乘坐舒适性,然而,该方案未顾及列车运行安全性,且无法保证运行时效性,无法平衡轨道车辆行驶的舒适性与时效性。


技术实现要素:



4.本发明所要解决的技术问题是,针对现有技术不足,提供一种轨道车辆及其运行优化控制方法、系统、存储介质,保证轨道车辆行驶时效性的同时,提高轨道车辆行驶舒适性。
5.为解决上述技术问题,本发明所采用的技术方案是:一种轨道车辆运行优化控制方法,包括以下步骤:
6.s1、将轨道车辆的行驶轨道划分为若干子轨道,每段子轨道的轨道参数相同;
7.s2、构建多尺度轨道车辆行驶评价指标;所述多尺度轨道车辆行驶评价指标包括轨道车辆的行驶能耗指标、行驶安全性指标以及舒适度指标;所述行驶能耗指标表示轨道车辆的剩余电能占比;所述行驶安全性指标表示轨道车辆在子轨道的行驶速度限制;所述舒适度指标表示轨道车辆到达站点的准时率以及在行驶过程中加速度变化的剧烈程度;
8.s3、根据所述行驶评价指标确定轨道车辆安全舒适运行一致性评价目标函数;
9.s4、将轨道车辆当前运行环境参数作为神经网络模型的输入,以轨道车辆在不同子轨道的车辆动力控制参数为神经网络模型的输出,训练所述神经网络模型,以最大化轨道车辆安全舒适运行一致性评价目标函数为训练后的神经网络模型参数优化目标,优化训练后的神经网络模型,得到车辆优化控制策略模型。
10.本发明基于轨道车辆行驶的安全性、舒适度以及能耗构建评价目标函数,以评价最高为目标构建轨道车辆优化控制策略模型进行轨道车辆的运行控制优化,轨道车辆优化控制策略模型会基于轨道车辆的出发时刻以及运行环境参数,确定当前站点与下一站点之间若干子轨道的轨道车辆动力控制参数,调节轨道车辆在每个子轨道的运行状况,实现更为安全、高效、节能以及舒适的轨道车辆运行调节,因此本发明的方法可以在保证轨道车辆行驶时效性的同时,提高轨道车辆行驶舒适性。本发明将轨道划分为多个子轨道,进一步提高了优化控制精度。
11.步骤s1中,所述轨道参数包括轨道的坡度、阻力系数以及轨道类型;所述轨道类型包括直线型和曲线型。
12.本发明的轨道参数全面考虑了轨道的坡度、阻力系数以及轨道类型等因素,可以确保准确控制轨道车辆相关参数,进一步提高乘坐舒适性。
13.步骤s3中,所述轨道车辆安全舒适运行一致性评价目标函数的表达式为:
[0014][0015]
其中,n表示从当前站点位置到下一个站点的子轨道数目,ai表示轨道车辆在子轨道xi的加速度,xi表示任意第i条子轨道,vi表示轨道车辆在子轨道xi末端的速度,α表示轨道车辆自身的阻力系数,βi={0,1},表示轨道车辆在子轨道xi的平均速度,v
i,
表示子轨道xi的限制速度,e表示轨道车辆从当前站点出发到达下一站点的计划耗费电能,t表示轨道车辆从当前站点行驶到下一站点的计划行驶时长,t

表示轨道车辆从当前站点出发的时间,表示轨道车辆从当前站点出发到达下一站点的实际耗费电能,m表示轨道车辆的质量;li表示子轨道xi的路径距离。
[0016]
为了进一步提高轨道车辆运行时效性和舒适性,步骤s4中,所述轨道车辆当前运行环境参数包括轨道坡度、轨道车辆阻力系数、子轨道参数、预计到站时间以及到达站点的轨道距离,所述子轨道参数包括不同子轨道的距离、坡度、轨道类型以及限制速度。
[0017]
本发明中,为了进一步提高优化控制精度,步骤s4中,训练所述神经网络模型,以最大化轨道车辆安全舒适运行一致性评价目标函数为训练后的神经网络模型参数优化目标的具体实现过程包括:
[0018]
1)对所述子轨道参数进行编码,得到子轨道参数的编码表示向量;
[0019]
2)从策略选择空间中选取编码表示向量的对应策略,所述策略选择空间中包含若干组不同的加速度,所选取的策略即为轨道车辆在对应子轨道的加速度;
[0020]
3)获取第i条子轨道xi的策略ai,基于轨道车辆在第i条子轨道xi的受力关系分析结果,得到轨道车辆在第i条子轨道xi的动力f(i);f(i)=mai+f

(i)+mgsinθi;其中,θi表示子轨道xi的坡度,ai表示轨道车辆在子轨道xi的加速度,的加速度,α表示轨道车辆自身的阻力系数,βi={0,1},g表示重力加速度;
[0021]
4)将所述动力f(i)转换为对应的车辆动力控制参数σ(i);
[0022]
5)重复上述步骤3)和步骤4),得到轨道车辆在n条子轨道上的一组车辆动力控制
参数集合{σ(i)|∈[1,]};
[0023]
6)重复步骤2)、步骤3)、步骤4)、步骤5),得到若干组车辆动力参数集合,将使得轨道车辆安全舒适运行一致性评价目标函数达到最大的一组车辆动力控制参数集合为最优控制策略。
[0024]
步骤s4中,优化训练后的神经网络模型的具体实现过程包括:
[0025]
a)初始化策略选取神经网络模型的参数θa;生成n组不同运行环境参数的轨道,其中所生成的第d组轨道具有md个子轨道;生成d组不同的加速度,将所生成的所有加速度构建为策略选择空间,则策略选择空间中任意第w组策略为aw;
[0026]
b)将轨道环境运行参数以及对应的策略选择空间存储在记忆库中,基于参数θa的策略选取神经网络模型为任意子轨道x
d,
选取策略aw,x
d,
表示所生成的第d组轨道中第u个子轨道;
[0027]
c)基于轨道车辆安全舒适运行一致性评价目标函数确定轨道车辆在任意子轨道
[0028]
x
d,
上选取策略aw的价值value(x
d,
,aw)为:
[0029]
其中:a
d,-1
表示所生成的第d组轨道中第u-1个子轨道x
d,-1
的加速度,∈[1,md],md表示第d组轨道中车辆的质量;
[0030]f′
(d,)表示轨道车辆在子轨道x
d,
的所受阻力;l
d,
表示子轨道x
d,
的长度距离,v
d,
表示轨道车辆在子轨道x
d,
末端的速度;
[0031]vu,
表示子轨道x
d,
的限制速度;
[0032]
d)重复步骤b)和步骤c),为每个子轨道选取策略,并通过最小化如下损失函数对神经网络模型参数θa进行更新,得到更新后的策略选取神经网络模型,即车辆优化控制策略模型;所述损失函数loss(θa)为:
[0033][0034]
其中,γ
d,,
(θa)={0,1},γ
d,,
(θa)=1表示基于参数θa的策略选取神经网络模型为任意子轨道x
d,
选取策略aw,γ
d,,
(θa)=0表示基于参数θa的策略选取神经网络模型没有为任意子轨道x
d,
选取策略aw,value(x
d,
,ax)表示从策略选择空间中为x
d,
选取对应的策略所产生价值的最大值;n为轨道的不同运行环境参数组数;d为不同加速度的组数。
[0035]
为便于不断优化车辆优化控制策略模型,本发明的方法还包括:
[0036]
e)将车辆优化控制策略模型所输出的最终控制策略保留到记忆库中。
[0037]
本发明中,获取车辆优化控制策略模型后,还包括:s5、利用车辆优化控制策略模型获取轨道车辆在后续轨道道路的动力控制参数。
[0038]
本发明中,步骤s5的具体实现过程包括:当轨道车辆到达当前站点进行停留时,将轨道车辆当前运行环境参数输入到车辆优化控制策略模型中,车辆优化控制策略模型输出轨道车辆在后续轨道道路的动力控制参数,基于所述动力控制参数进行轨道车辆运行状况的实时控制调节(即调节轨道车辆的速度以及加速度),其中所述轨道车辆运行状况包括轨道车辆的速度以及加速度。
[0039]
本发明通过优化控制调节轨道车辆的速度以及加速度,在保证车辆运行时效性的
同时,提高了乘客乘坐舒适性,确保了轨道车辆行驶的舒适性、安全性、时效性。利用深度学习方法,主动调整轨道车辆的运行速度,最大程度地避免了轨道粗糙引起的振动和冲击。
[0040]
作为一个发明构思,本发明还提供了一种轨道交通车辆运行优化控制系统,包括存储器、处理器及存储在存储器上的计算机程序;其特征在于,所述处理器执行所述计算机程序,以实现本发明上述方法的步骤。
[0041]
作为一个发明构思,本发明还提供了一种轨道车辆,其采用本发明上述运行优化控制系统。
[0042]
作为一个发明构思,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序/指令;所述计算机程序/指令被处理器执行时实现本发明上述方法的步骤。
[0043]
与现有技术相比,本发明所具有的有益效果为:本发明基于轨道车辆的出发时刻以及运行环境参数,确定当前站点与下一站点之间若干子轨道的轨道车辆动力控制参数,调节轨道车辆在每个子轨道的运行状况,实现了更为安全、高效、节能以及舒适的轨道车辆运行调节,可以主动避免轨道粗糙度引起的乘客振动和冲击,平衡了轨道车辆行驶的舒适性与时效性。
附图说明
[0044]
图1为本发明实施例1方法流程图;
[0045]
图2为本发明实施例2轨道车辆运行优化控制系统的功能模块图;
[0046]
图3为本发明实施例2轨道车辆运行优化控制系统结构图。
具体实施方式
[0047]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0048]
在本文中,术语“包含”、“包括”和其它类似词语意在表示逻辑上的相互关系,而不能视作表示空间结构上的关系。例如,“a包括b”意在表示在逻辑上b属于a,而不表示在空间上b位于a的内部。另外,术语“包含”、“包括”和其它类似词语的含义应视为开放性的,而非封闭性的。例如,“a包括b”意在表示b属于a,但是b不一定构成a的全部,a还可能包括c、d、e等其它元素。
[0049]
本发明实施例轨道车辆运行优化控制方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施例提供的该方法的电子设备中的至少一种。换言之,所述轨道车辆运行优化控制方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集、云端服务器或云端服务器集等。
[0050]
实施例1
[0051]
本发明实施例1提供了一种轨道车辆运行优化控制方法,如图1所示,该方法包括以下步骤:
[0052]
s1:将轨道车辆的行驶轨道划分为若干子轨道,构建多尺度轨道车辆行驶评价指
标,并根据构建的评价指标确定轨道车辆安全舒适运行一致性评价目标函数。
[0053]
步骤s1中将轨道车辆的行驶轨道划分为若干子轨道,包括:
[0054]
轨道车辆表示可以在轨道上行驶的车辆,主要包括地铁、轻轨、火车以及高铁等,轨道车辆在行驶过程中具有若干到站点,当轨道车辆到达到站点时会停留。
[0055]
将轨道车辆的行驶轨道划分为若干子轨道,每段子轨道的轨道参数相同,轨道参数包括轨道的坡度、阻力系数以及轨道类型,其中轨道类型包括直线型以及曲线类型,并限制每段子轨道最长为2千米。
[0056]
在本发明实施例中,当轨道车辆到达当前站点进行停留时,轨道车辆优化控制策略模型会基于轨道车辆的出发时刻以及运行环境参数,确定当前站点与下一站点之间若干子轨道的轨道车辆动力控制参数,调节轨道车辆在每个子轨道的运行状况,实现更为安全、高效、节能以及舒适的轨道车辆运行调节。
[0057]
轨道车辆从当前站点位置到达下一站点的子轨道集合为{xi|∈[1,]},其中n表示从当前站点位置到下一个站点的子轨道数目,xi表示任意第i条子轨道,轨道车辆在任意两条子轨道交点处调节动力控制参数,控制轨道车辆的运行状况,其中所述轨道车辆运行状况包括轨道车辆的速度以及加速度。
[0058]
步骤s1中构建多尺度轨道车辆行驶评价指标,包括:
[0059]
轨道车辆行驶评价指标包括轨道车辆的行驶能耗指标、行驶安全性指标以及舒适度指标;
[0060]
行驶能耗指标表示轨道车辆的剩余电能占比,剩余电能占比越高表示轨道车辆在行驶过程中消耗的电能越少,在本发明实施例中,轨道车辆行驶过程中会将电能转换为行驶动能,为轨道车辆行驶提供动力;
[0061]
行驶安全性指标表示轨道车辆在子轨道的行驶速度限制,不同子轨道具有不同的限制速度,若轨道车辆的子轨道的行驶速度超过对应的限制速度,则表示可能发生危险;
[0062]
舒适度指标表示轨道车辆到达站点的准时率以及在行驶过程中加速度变化的剧烈程度,其中准时率越高,加速度变化剧烈程度越低,则舒适度指标越高。
[0063]
步骤s1中根据构建的评价指标确定轨道车辆安全舒适运行一致性评价目标函数,包括:
[0064]
根据构建的评价指标确定轨道车辆安全舒适运行一致性评价目标函数,所构建的目标函数为:
[0065][0066]
f(i)-f

(i)-mgsinθi=mai[0067][0068][0069]
[0070]
t=t
″‑
t

[0071]
vi=v
i-1
+aiti′
[0072]
其中:
[0073]
f(i)表示轨道车辆在子轨道xi的动力,所述动力包括牵引力和制动力,由轨道车辆自身提供;
[0074]ai
表示轨道车辆在子轨道xi的加速度;
[0075]
vi表示轨道车辆在子轨道xi末端的速度,表示轨道车辆在子轨道xi的平均速度,所述轨道车辆在子轨道xi起始端的速度为v
i-1

[0076]vi,limit
表示子轨道xi的限制速度;
[0077]
θi表示子轨道xi的坡度;
[0078]
li表示子轨道xi的路径距离,ti表示轨道车辆从子轨道xi起始端出发,行驶到子轨道xi末端的所需时间,t

表示轨道车辆到达下一站点的计划到达时间,t

表示轨道车辆从当前站点出发的时间,t表示轨道车辆从当前站点行驶到下一站点的计划行驶时长,表示轨道车辆从当前站点行驶到下一站点的实际行驶时长;
[0079]
e表示轨道车辆从当前站点出发到达下一站点的计划耗费电能,表示轨道车辆从当前站点出发到达下一站点的实际耗费电能;
[0080]f′
(i)表示轨道车辆在子轨道xi的阻力,g表示重力加速度,α表示轨道车辆自身的阻力系数,βi={0,1},若βi=0,表示子轨道xi为直线,若βi=1,表示子轨道xi为曲线,ri则表示对应的曲线半径;
[0081]
对应舒适度指标,|a
i-a
i-1
|越小则表示轨道车辆行驶过程中加速度的变化程度越小,车辆突然加速或减速产生的车身抖动频率降低,则的值越高;对应舒适度指标,表示轨道车辆到达下一站点的早点时长或晚点时长,轨道车辆的早点或晚点均会影响轨道上其余车辆的运行,表示轨道车辆准时到达;
[0082]
对应行驶能耗指标;对应行驶安全性指标;
[0083]
本实施例中目标函数的待求解参数为轨道车辆在不同子轨道的动力,基于求解得到的轨道车辆动力对轨道车辆在不同子轨道的动力参数进行控制,使得轨道车辆的运行满足安全、高效、节能以及舒适的指标条件。
[0084]
步骤s1中轨道车辆安全舒适运行一致性评价目标函数的约束条件,包括:
[0085]
目标函数的约束条件为:
[0086][0087]
其中:
[0088]vmax
表示轨道车辆的最大行驶速度,v表示轨道车辆在任意时刻的行驶速度,若轨道车辆通过加速达到速度v
max
,以速度v
max
进行匀速行驶;
[0089]
a表示加速度阈值;
[0090]
v1表示轨道车辆从当前站点出发的速度,vn表示轨道车辆到达下一站点的速度。
[0091]
s2:构建轨道车辆优化控制策略模型,其中深度神经网络模型为所述轨道车辆优化控制策略模型的主要模型结构,模型的输入为轨道车辆当前运行环境参数,包括轨道车辆阻力系数、子轨道参数、预计到站时间以及到达站点的轨道距离,子轨道参数包括不同子轨道的距离、坡度、轨道类型以及限制速度,模型的输出为轨道车辆在不同子轨道的车辆动力控制参数。
[0092]
步骤s2中构建轨道车辆优化控制策略模型,其中深度神经网络模型为所述轨道车辆优化控制策略模型的主要模型结构,包括:
[0093]
构建轨道车辆优化控制策略模型,其中深度神经网络模型为所述轨道车辆优化控制策略模型的主要模型结构,所述轨道车辆优化控制策略模型包括输入层、编码层、策略选择层以及输出层;
[0094]
策略选择层包括策略选取神经网络以及策略评价神经网络,策略选择层接收编码层输入的编码表示向量,策略选取神经网络用于从策略选取空间中选取策略,策略评价神经网络用于对所选取策略集合进行评价,将评价结果最好的策略集合作为最终控制策略。
[0095]
轨道车辆优化控制策略模型的运行流程为:
[0096]
s21:输入层接收输入模型的参数值,所述模型的输入为轨道车辆当前运行环境参数,包括轨道坡度、轨道车辆阻力系数、子轨道参数、预计到站时间以及到达站点的轨道距离,子轨道参数包括不同子轨道的距离、坡度、轨道类型以及限制速度;
[0097]
s22:编码层对接收的子轨道参数进行编码表示,得到子轨道参数的编码表示向量,并将子轨道参数的编码表示向量以及所接收到的其余参数输入到策略选择层;
[0098]
s23:策略选择层从策略选择空间中选取编码表示向量的对应策略,所述策略选择空间中包含若干组不同的加速度,所选取的策略即为轨道车辆在该子轨道的加速度,在本发明实施例中,所述加速度取值范围满足目标函数的约束条件;
[0099]
s24:输出层接收所选取任意子轨道xi的策略ai,并基于轨道车辆在任意子轨道xi的受力关系分析结果得到轨道车辆在任意子轨道xi的动力f(i):
[0100]
f(i)=mai+f

(i)+mgsinθi;
[0101]
并将所述动力f(i)转换为对应的车辆动力控制参数σ(i)进行输出;
[0102]
轨道车辆基于车辆动力控制参数σ(i)在子轨道xi上行驶,则轨道车辆在子轨道xi的加速度为ai;
[0103]
重复步骤s24,得到轨道车辆在n条子轨道上的一组车辆动力控制参数集合{σ(i)|∈[1,]};重复该步骤,得到若干组车辆动力参数集合,利用策略选择层中的策略评价神经网络对每组车辆动力控制参数进行评价。评价依据为使得轨道车辆安全舒适运行一致性评价目标函数达到最大的一组车辆动力控制参数集合为最优控制策略。
[0104]
s3:基于离线优化策略对轨道车辆优化控制策略模型进行参数优化,得到优化后的轨道车辆优化控制策略模型,其中深度确定性策略梯度优化算法为所述离线优化策略的主要方法,所述参数优化目标为最大化轨道车辆安全舒适运行一致性评价目标函数。
[0105]
步骤s3中基于离线优化策略对轨道车辆优化控制策略模型进行优化,包括:
[0106]
轨道车辆优化控制策略模型的待优化模型参数包括策略选取神经网络,其中深度
确定性策略梯度优化算法为所述离线优化策略的主要方法;
[0107]
轨道车辆优化控制策略模型的优化流程为:
[0108]
s31:初始化策略选取神经网络的参数θa;
[0109]
s32:生成n组不同运行环境参数的轨道,其中所生成的第d组轨道具有md个子轨道;
[0110]
s33:生成d组不同的加速度,将所生成的所有加速度构建为策略选择空间,则策略选择空间中任意第w组策略为aw;
[0111]
s34:将所生成的轨道环境运行参数以及对应的策略选择空间存储在记忆库中,基于参数θa的策略选取神经网络为任意子轨道x
d,
选取策略aw,x
d,
表示所生成的第d组轨道中第u个子轨道;
[0112]
s35:基于轨道车辆安全舒适运行一致性评价目标函数确定轨道车辆在任意子轨道x
d,
上选取策略aw的价值为:
[0113][0114]
其中:
[0115]ad,-1
表示子轨道x
d,-1
的加速度,x
d,
表示所生成的第d组轨道中第u个子轨道,u∈[1,md];,md表示第d组轨道中车辆的质量
[0116]f′
(d,)表示轨道车辆在子轨道x
d,
的所受阻力;
[0117]
l
d,
表示子轨道x
d,
的长度距离,v
d,
表示轨道车辆在子轨道x
d,
末端的速度;
[0118]
s36:重复上述步骤s34-s35,利用策略选取神经网络为每个子轨道选取策略,并通过最小化如下损失函数对模型参数θa进行更新,得到更新后的策略选取神经网络,所述损失函数loss(θa)为:
[0119][0120]
其中:
[0121]
γ
d,,
(θa)={0,1},γ
d,,
(θa)=1表示基于参数θa的策略选取神经网络为任意子轨道x
d,
选取策略aw,γ
d,,
(θa)=0表示基于参数θa的策略选取神经网络没有为任意子轨道x
d,
选取策略aw;
[0122]
value(x
d,
,ax)表示从策略选择空间中为x
d,
选取对应的策略,所产生价值的最大值;
[0123]
将优化后轨道车辆优化控制策略模型所输出的最终控制策略保留到记忆库中。
[0124]
s4:利用优化后的轨道车辆优化控制策略模型输出轨道车辆在后续轨道道路的动力控制参数,基于轨道车辆的实时动力控制参数进行轨道车辆运行状况的实时控制调节,其中轨道车辆运行状况包括轨道车辆的速度以及加速度。
[0125]
步骤s4中利用优化后的轨道车辆优化控制策略模型输出轨道车辆在后续轨道道路的动力控制参数,包括:将轨道车辆当前运行环境参数输入到优化后的轨道车辆优化控制策略模型中,模型输出轨道车辆在后续轨道道路的动力控制参数,轨道车辆基于所述动力控制参数进行轨道车辆运行状况的实时控制调节,其中所述轨道车辆运行状况包括轨道
车辆的速度以及加速度。
[0126]
实施例2
[0127]
如图2所示,本实施例提供了一种轨道车辆运行优化控制系统的功能模块图,其可以实现实施例1中的轨道车辆运行优化控制方法。
[0128]
轨道车辆运行优化控制系统100可以安装于电子设备中。根据实现的功能,轨道车辆运行优化控制系统可以包括数据采集模块101、模型构建装置102及模型优化模块103。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
[0129]
数据采集模块101,用于将轨道车辆的行驶轨道划分为若干子轨道,采集轨道车辆当前运行环境参数,包括轨道车辆阻力系数、子轨道参数、预计到站时间以及到达站点的轨道距离,子轨道参数包括不同子轨道的距离、坡度、轨道类型以及限制速度;
[0130]
模型构建装置102,用于构建多尺度轨道车辆行驶评价指标,并根据构建的评价指标确定轨道车辆安全舒适运行一致性评价目标函数,构建轨道车辆优化控制策略模型;
[0131]
模型优化模块103,用于基于离线优化策略对轨道车辆优化控制策略模型进行参数优化,利用优化后的轨道车辆优化控制策略模型输出轨道车辆在后续轨道道路的动力控制参数,基于轨道车辆的实时动力控制参数进行轨道车辆运行状况的实时控制调节。
[0132]
详细地,本发明实施例中轨道车辆运行优化控制系统100中的所述各模块在使用时采用与上述的图1中所述的轨道车辆运行优化控制方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
[0133]
实施例3
[0134]
本实施例提供的轨道车辆运行优化控制系统见图3。包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如程序12。处理器执行存储器上的计算机程序,以实现上述实施例1方法的步骤。
[0135]
在一些实现中,存储器可以是高速随机存取存储器(ram:random access memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
[0136]
在另一些实现中,处理器可以为中央处理器(cpu)、数字信号处理器(dsp)等各种类型通用处理器,在此不做限定。
[0137]
存储器11至少包括一种类型的可读存储介质,可读存储介质包括常规的可移动存储介质,例如:u盘,sd卡,固态硬盘等,也可以是新型的存储介质,如:铁电存储器feram,磁性随机存储器mram,相变存储器oum,pcm相变存储器,reram阻抗随机存储器,nram碳纳米管随机存储器等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,同时在另一些实施例中也可以是电子设备1的外部存储设备,例如集成于cpu处理器的内部flash存储空间,也可以是电子设备内部pcba电路板上单独挂载的各类板载存储芯片。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部通过i2c、spi、usb、mvb、trdp等通讯总线扩展的外部存储设备。所述存储器11不仅用于存储电子设备1正常运行的操作系统、采集和控制所需要的应用程序,以及用于算法及策略优化所需要的大数据存储,例如程序12的代码等。
[0138]
处理器10在一些实施例中可以由mcu微处理器,比如c51、avr、cortex-m、dsp等芯
片,也可以由性能和功能更加强大的mpu微处理器,如:intel x86,飞思卡尔i.mx6、全志a20、ti am335x等组成。进一步的,处理器10还可以包括除mcu及mpu以外的电子设备1必须的控制核心最小系统部件,如:晶体振荡电路、电源供电系统、代码下载接口、必要的运行和状态指示电路等。所述处理器10是所述电子设备的控制核心,通过运行或执行存储在所述存储器11内的程序或者模块(用于轨道车辆运行优化控制的程序12等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
[0139]
总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。总线可以是数据总线、地址总线和控制总线,也可以根据应用场景的任意组合,所述的电子设备总线可以基于标准的串口通讯协议,如rs232、rs485、can等,也可以是一些特定的总线协议,如advanced extensible interface,profinet、ethercat等。进一步的,也可以是由自行定义的专用协议。
[0140]
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0141]
例如,尽管未说明,电子设备1还可以包括互为冷热备份的冗余部件,如cpu板、电源板等,通过一个或多个冗余备份的部件,能够极大的提高系统的可靠性和可用性,进一步的提升系统的功能和性能。电子设备1还可以包括各类外部的通讯和定位功能模块,如:4g、5g接口模块、zigbee通讯模块、gps、北斗定位模块等,在此不再赘述。
[0142]
实施例4
[0143]
本发明实施例4提供了一种对应上述实施例1的计算机可读存储介质,其上存储有计算机程序/指令。计算机程序/指令被处理器执行时,实现上述实施例1方法的步骤。
[0144]
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意组合。
[0145]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本技术实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言java和直译式脚本语言javascript等。
[0146]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0147]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一
个方框或多个方框中指定的功能的步骤。
[0148]
尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
[0149]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。

技术特征:


1.一种轨道车辆运行优化控制方法,其特征在于,包括以下步骤:s1、将轨道车辆的行驶轨道划分为若干子轨道,每段子轨道的轨道参数相同;s2、构建多尺度轨道车辆行驶评价指标;所述多尺度轨道车辆行驶评价指标包括轨道车辆的行驶能耗指标、行驶安全性指标以及舒适度指标;所述行驶能耗指标表示轨道车辆的剩余电能占比;所述行驶安全性指标表示轨道车辆在子轨道的行驶速度限制;所述舒适度指标表示轨道车辆到达站点的准时率以及在行驶过程中加速度变化的剧烈程度;s3、根据所述行驶评价指标确定轨道车辆安全舒适运行一致性评价目标函数;s4、将轨道车辆当前运行环境参数作为神经网络模型的输入,以轨道车辆在不同子轨道的车辆动力控制参数为神经网络模型的输出,训练所述神经网络模型,以最大化轨道车辆安全舒适运行一致性评价目标函数为训练后的神经网络模型参数优化目标,优化训练后的神经网络模型,得到车辆优化控制策略模型。2.根据权利要求1所述的轨道车辆运行优化控制方法,其特征在于,步骤s1中,所述轨道参数包括轨道的坡度、阻力系数以及轨道类型;所述轨道类型包括直线型和曲线型。3.根据权利要求1所述的轨道车辆运行优化控制方法,其特征在于,步骤s3中,所述轨道车辆安全舒适运行一致性评价目标函数的表达式为:其中,n表示从当前站点位置到下一个站点的子轨道数目,a
i
表示轨道车辆在子轨道x
i
的加速度,x
i
表示任意第i条子轨道,v
i
表示轨道车辆在子轨道x
i
末端的速度,α表示轨道车辆自身的阻力系数,β
i
={0,1},表示轨道车辆在子轨道x
i
的平均速度,v
i,
表示子轨道x
i
的限制速度,e表示轨道车辆从当前站点出发到达下一站点的计划耗费电能,t表示轨道车辆从当前站点行驶到下一站点的计划行驶时长,t

表示轨道车辆从当前站点出发的时间,表示轨道车辆从当前站点出发到达下一站点的实际耗费电能,m表示轨道车辆的质量,l
i
表示子轨道x
i
的路径距离。4.根据权利要求1所述的轨道车辆运行优化控制方法,其特征在于,步骤s4中,所述轨道车辆当前运行环境参数包括轨道坡度、轨道车辆阻力系数、子轨道参数、预计到站时间以及到达站点的轨道距离,所述子轨道参数包括不同子轨道的距离、坡度、轨道类型以及限制速度。5.根据权利要求1所述的轨道车辆运行优化控制方法,其特征在于,步骤s4中,训练所述神经网络模型,以最大化轨道车辆安全舒适运行一致性评价目标函数为训练后的神经网络模型参数优化目标的具体实现过程包括:1)对所述子轨道参数进行编码,得到子轨道参数的编码表示向量;2)从策略选择空间中选取编码表示向量的对应策略,所述策略选择空间中包含若干组不同的加速度,所选取的策略即为轨道车辆在对应子轨道的加速度;3)获取第i条子轨道x
i
的策略a
i
,基于轨道车辆在第i条子轨道x
i
的受力关系分析结果,得到轨道车辆在第i条子轨道x
i
的动力f(i);f(i)=ma
i
+f

(i)+mgsinθ
i
;其中,θ
i
表示子轨道
x
i
的坡度,a
i
表示轨道车辆在子轨道x
i
的加速度,α表示轨道车辆自身的阻力系数,β
i
={0,1},g表示重力加速度;4)将所述动力f(i)转换为对应的车辆动力控制参数σ(i);5)重复上述步骤3)和步骤4),得到轨道车辆在n条子轨道上的一组车辆动力控制参数集合{σ(i)|∈[1,]};6)重复上述步骤2)~步骤5),得到若干组车辆动力参数集合,将使得轨道车辆安全舒适运行一致性评价目标函数达到最大的一组车辆动力控制参数集合为最优控制策略。6.根据权利要求5所述的轨道车辆运行优化控制方法,其特征在于,步骤s4中,优化训练后的神经网络模型的具体实现过程包括:a)初始化策略选取神经网络模型的参数θ
a
;生成n组不同运行环境参数的轨道,其中所生成的第d组轨道具有m
d
个子轨道;生成d组不同的加速度,将所生成的所有加速度构建为策略选择空间,则策略选择空间中任意第w组策略为a
w
;b)将轨道环境运行参数以及对应的策略选择空间存储在记忆库中,基于参数θ
a
的策略选取神经网络模型为任意子轨道x
d,
选取策略a
w
,x
d,
表示所生成的第d组轨道中第u个子轨道;c)基于轨道车辆安全舒适运行一致性评价目标函数确定轨道车辆在任意子轨道x
d,
上选取策略a
w
的价值value(x
d,
,a
w
)为:)为:其中:a
d,-1
表示所生成的第d组轨道中第u-1个子轨道x
d,-1
的加速度,∈[1,m
d
],m
d
表示第d组轨道中车辆的质量;f

(d,)表示轨道车辆在子轨道x
d,
的所受阻力;l
d,
表示子轨道x
d,
的长度距离,v
d,
表示轨道车辆在子轨道x
d,
末端的速度;v
u,
表示子轨道x
d,
的限制速度;d)重复步骤b)和步骤c),为每个子轨道选取策略,并通过最小化如下损失函数对神经网络模型参数θ
a
进行更新,得到更新后的策略选取神经网络模型,即车辆优化控制策略模型;所述损失函数loss(θ
a
)为:其中,γ
d,,

a
)={0,1},γ
d,,

a
)=1表示基于参数θ
a
的策略选取神经网络模型为任意子轨道x
d,
选取策略a
w
,γ
d,,

a
)=0表示基于参数θ
a
的策略选取神经网络模型没有为任意子轨道x
d,
选取策略a
w
,value(x
d,
,ax)表示从策略选择空间中为x
d,
选取对应的策略所产生价值的最大值;n为轨道的不同运行环境参数组数;d为不同加速度的组数。7.根据权利要求6所述的轨道车辆运行优化控制方法,其特征在于,还包括:e)将车辆优化控制策略模型所输出的最终控制策略保留到记忆库中。8.根据权利要求1~7之一所述的轨道车辆运行优化控制方法,其特征在于,还包括:s5、利用车辆优化控制策略模型获取轨道车辆在后续轨道道路的动力控制参数。9.根据8所述的轨道车辆运行优化控制方法,其特征在于,步骤s5的具体实现过程包
括:当轨道车辆到达当前站点进行停留时,将轨道车辆当前运行环境参数输入到车辆优化控制策略模型中,车辆优化控制策略模型输出轨道车辆在后续轨道道路的动力控制参数,基于所述动力控制参数进行轨道车辆运行状况的实时控制调节,其中所述轨道车辆运行状况包括轨道车辆的速度以及加速度。10.一种轨道交通车辆运行优化控制系统,其特征在于,包括存储器、处理器及存储在存储器上的计算机程序;其特征在于,所述处理器执行所述计算机程序,以实现权利要求1~9之一所述方法的步骤。11.一种轨道车辆,其特征在于,其采用权利要求10所述控制系统。12.一种计算机可读存储介质,其上存储有计算机程序/指令;其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1~9之一所述方法的步骤。

技术总结


本发明公开了一种轨道车辆及其运行优化控制方法、系统、存储介质,基于轨道车辆行驶的安全性、舒适度以及能耗构建评价目标函数,以评价最高为目标构建轨道车辆优化控制策略模型进行轨道车辆的运行控制优化,轨道车辆优化控制策略模型会基于轨道车辆的出发时刻以及运行环境参数,确定当前站点与下一站点之间若干子轨道的轨道车辆动力控制参数,调节轨道车辆在每个子轨道的运行状况,实现更为安全、高效、节能以及舒适的轨道车辆运行调节。节能以及舒适的轨道车辆运行调节。节能以及舒适的轨道车辆运行调节。


技术研发人员:

齐然 李时民 刘波 杨晓权 汤诚 刘强

受保护的技术使用者:

中车株洲电力机车有限公司

技术研发日:

2022.12.01

技术公布日:

2023/3/28

本文发布于:2024-09-23 05:28:01,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/82749.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:轨道   车辆   策略   所述
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议