一种基于多移动防御资源和移动目标的新型变电站安全保护方法



1.本发明属于移动变电站安全保护领域,具体涉及一种基于多移动防御资源和移动目标的新型变电站安全保护方法。


背景技术:



2.移动变电站凭借着自身运行灵活机动的优势,能够作为可靠电源供给许多临时性大负荷或者作为抢险救灾后的应急电源,其重要性不言而喻。如今5g移动变电站的发展让人们可以预见未来将会有更多的移动变电站投入运行并在供电环节中承担重要的任务。同时也正是因为移动变电站出的机动性,使其容易在移动过程中遭受攻击,严重情况下将会造成国民经济的重大损失。移动变电站运行过程中的安全保护问题急需成熟的解决方案。近年来博弈论决策支持系统已成功部署在多个领域,用以帮助安全机构保护关键基础设施。这些决策支持系统帮助防御方分配和调度有限的资源来保护目标免受恶意攻击,特别是鉴于有限的安全资源不可能始终覆盖或保护所有目标。对于目前许多安全领域内的资源分配和调度问题,现有文献中构建的模型总是假设被保护的目标相对于攻防双方都是静止的,这就导致模型呈现离散化状态并且攻防策略呈现为有限的纯策略,无法满足多移动防御资源和移动目标的复杂情况。


技术实现要素:



3.为了解决上述背景技术提到的技术问题,本发明提出了一种基于多移动防御资源和移动目标的新型变电站安全保护方法。
4.为了实现上述技术目的,本发明的技术方案为:
5.一种基于多移动防御资源和移动目标的新型变电站安全保护方法,包括以下步骤:
6.s1、建立包含多移动防御资源和移动目标的攻击方-防御方stackelberg博弈模型,攻击方具有连续的策略空间,防御方具有离散化的策略空间;
7.s2、使用缩减表示法表示防御方混合策略,利用子区间分析法构建攻击方的连续策略,结合防御方混合策略和攻击方的连续策略得到计算连续攻击方策略空间情况下的极大极小解的求解器,用于求解最优防御策略;
8.s3、基于步骤s1的多移动防御资源和移动目标的攻击方-防御方stackelberg博弈模型结合步骤s2求解所得的防御方、攻击方策略情况,通过路径调整法,对步骤s2所生成防御策略进行比较更新;
9.s4、部署移动防御资源,防御方根据步骤s3中更新后的防御策略部署移动防御资源保护移动变电站。
10.优选地,步骤s1中,防御方采用混合策略,攻击方在观察并评估该混合策略后做出响应;攻击方在执行攻击时不考虑移动防御资源当前的部分路线,仅考虑发起攻击时间
时移动防御资源的位置;
11.攻击方在目标移动过程中的任何时间点发起攻击,从而形成一套连续的策略;防御方部署一组移动防御资源来保护这些目标;本模型设定攻击方一次只能对一个目标发动攻击;
12.博弈模型属于零和博弈,一方获得的收益建立在另一方遭到损失的基础上;防御方需要调度移动防御资源来最小化攻击方的预期效用;
13.攻击方对某一目标发动攻击获得的预期效用根据目标的位置和时间变化,目标的移动安排是固定的。
14.优选地,步骤s1具体指:构建攻击方策略模型,表征攻击方的预期效用及策略函数;构建防御方策略模型,表征防御方的预期效用及策略函数;构建约束条件,包括:移动防御资源的速度限制约束条件,移动防御资源的保护半径约束条件,移动变电站的时间约束条件和空间约束条件。
15.优选地,所述攻击方策略模型公式表达如下:
16.atteuf(fq,t)=1-cgωf(fq,t)uq(t),cg∈[0,1]
ꢀꢀꢀ
(1)
[0017]
<q,t>
ꢀꢀꢀ
(2)
[0018]
式中,atteuf(fq,t)表示当防御方的混合策略为f时攻击方在时间t攻击目标fq的预期效用;cg表示保护的强度,即移动防御资源能成功阻止攻击方的概率,下标g表示处在攻击目标保护范围内的移动防御资源数量;ωf(fq,t)表示在时间t移动防御资源能保护目标fq的可能性;uq(t)是时间t的分段线性函数,表示攻击方在时间t对某一移动变电站fq发动一次成功攻击所能得到的收益;策略函数<q,t>中q和t分别表示是攻击目标的编号和攻击时间。
[0019]
优选地,所述防御方策略模型公式表达如下:
[0020][0021][0022]ru
:t
→dꢀꢀꢀ
(5)
[0023]
式中,defeuf表示防御方的预期效用;f表示防御方采取的混合策略,最优防御策略是一种策略f',使得最小;ru表示编号为u移动防御资源的时间位置关系,t和d分别代表一个连续的时间域和一个连续的空间域。
[0024]
优选地,移动防御资源的速度限制约束、保护半径约束、移动变电站的时间和空间约束条件公式表达如下:
[0025]
v≤vmꢀꢀꢀ
(6)
[0026]
0≤r≤reꢀꢀꢀ
(7)
[0027]
sq:t
→dꢀꢀꢀ
(8)
[0028]
式中,v表示移动防御资源的速度,vm表示移动防御资源的速度上限;r表示移动防御资源的保护范围,re表示移动防御资源的保护范围上限;sq表示编号为q的移动变电站的时间位置关系并且sq是分段线性的;t和d分别代表一个连续的时间域和一个连续的空间域。
[0029]
优选地,步骤s2中使用缩减表示法表示防御方混合策略具体指:将连续的时间离
散为均匀分布的m个点t={t1,t2,...,tm},用δ
t
表示两个相邻时间点间的间隔,并设定δ
t
足够小以保证在任意时间段[tk,t
k+1
]上对于任何目标fq,sq和uq(t)是线性的;同时用一组点d={d1,d2,...,dm}将移动防御资源以及移动变电站的移动路线离散化,并规定每个移动防御资源在任何离散化时间点tk只能停留在离散化的某个点di上,此时一台移动防御资源的路径公式表达如下:
[0030][0031]
式中ru(k)表示移动防御资源在时间tk时停留的离散点的编号,路径ru表示移动防御资源在时间段[tk,t
k+1
]内从点移动到
[0032]
路径ru确定时,边也随之固定,选择边e
i,j,k
的总概率是所有起点为ru(k)=i、终点为ru(k+1)=j的路线ru概率总和,定义流f(i,j,k)公式表达如下:
[0033][0034]
式中p(ru)是采取路径ru的概率,f(i,j,k)表示在时间tk移动防御资源从位置di出发并在时间t
k+1
时移动到位置dj的概率。
[0035]
优选地,步骤s2中利用子区间分析法精确建模攻击方的连续策略具体指:将任意时间段(tk,t
k+1
)划分为子区间其中r=0,...,m
qk
,设置,设置,设置表示距离变电站fq保护极限re的边界范围与边e
i,j,k
对于任何目标fq和任何时间间隔(tk,t
k+1
)产生的时间交点,m
qk
是交点的总数;定义g=(v,e),其中顶点集v对应于移动防御资源可能在t中离散化时间点处的位置,e是移动防御资源可以采取的可行边集;则移动变电站fq的保护范围公式表达如下
[0036]
βq(t)={v=(x,y):||v-sq(t)||≤re}
ꢀꢀꢀ
(11)
[0037]
式中,βq(t)表示t时刻移动变电站fq的保护范围;sq(t)表示移动变电站fq在t时刻所处的位置;re表示移动防御资源的最大保护半径;
[0038]
进攻方的最大预期效用公式表达如下:
[0039][0040]
式中,和分别表示atteuf在子区间两侧的极限。
[0041]
优选地,步骤s2中,计算连续攻击方策略空间情况下的极大极小解的求解器公式表达如下:
[0042][0043][0044][0045]
[0046][0047][0048][0049][0050][0051]
式中z是攻击方预期效用的最大值;f(i1,j1,...,iw,jw,k)表示第一台移动防御资源在时间tk到t
k+1
期间从移动到第二台移动防御资源在时间tk到t
k+1
期间从移动到以此类推所得的第w台移动防御资源在时间tk到t
k+1
期间从移动到的联合概率;p(i1,...,iw,k)表示在时间tk时,第一台移动防御资源在第二台移动防御资源在以此类推第w台移动防御资源在的联合概率;表示节点和在二维空间中的欧几里德距离;vm表示移动防御资源的速度上限;δ
t
表示两个相邻离散时间点的间隔;atteuf(fq,tk)表示当防御方的混合策略为f时攻击方在时间tk攻击目标fq的预期效用;和分别表示atteuf在子区间两侧的极限,其中r=0,...,m
qk
,设置,设置表示距离变电站fq保护极限re的边界范围与边e
i,j,k
对于任何目标fq和任何时间间隔(tk,t
k+1
)产生的时间交点,m
qk
是交点的总数;;ωf(fq,tk)表示在时间tk移动防御资源能保护目标fq的可能性;uq(tk)表示攻击方在时间tk对某一移动变电站fq发动一次成功攻击所能得到的收益;i(iu,q,k)表示tk时能保护目标q的移动防御资源数量;cq表示q台移动防御资源的保护强度。
[0052]
优选地,步骤s3中路径调整法考虑到求解过程建立在攻击方不受任何约束,能够在任意时间点对任意目标发动攻击以获得最大的预期效用的前提下;当攻击方受到了一定的约束;此时求解得到的策略f并不能达到最优效果;因此需要通过改进防御方策略,使其对受约束的攻击方更具鲁棒性,同时保持防御方对无约束攻击方的预期效用不变;当到新的防御策略f'使得对于任何攻击方策略《q,t》,防御方在f'下的预期效用≥在f下的预期效用,并且对于至少一个特定的攻击方策略,防御方在f'下的预期效用严格大于f下的预期效用,此时称策略f'优于策略f,表达式如下:
[0053][0054]
式中defeuf(fq,t)表示防御方在策略f下的预期效用;defeu
f'
(fq,t)表示防御方在策略f'下的预期效用;
[0055]
路径调整法具体表示如下:
[0056]
s31、先通过迭代查包含最小概率边的路径,将f分解为多条路径;初始化剩余流分布路径集s=φ,和路径上的概率分布;当时设
令并寻任意以使得和(即在路径里)且将添加到路径集s并设若且设
[0057]
s32、逐一调整s中的每条路径,以获得一组新的路径集s'和相应的新概率分布p';初始化新路径集s'=φ,新概率分布当s≠φ时,从s中挑选一条路径ru,调整ru以得到新路径r
u'
:对于给定的ru和k
*
,若k≠k
*
,则设置ru;(k)=ru(k);设置r
u'
(k
*
)=i0以使e(u1,k
*-1)和e(u1,k
*
)达到速度限制,当选择i0时r
u'
优于ru,r
u'
不受具有任何其他i0选择的路径支配;如果不存在这样的i0,设置r
u'
(k
*
)=ru(k
*
),添加ru到路径集s'并设置p'(r
u'
)=p(ru);最后将ru从路径集s中移除;
[0058]
s33、从s'和p'重建新的缩减表示f'此时得到一个新的防御策略f',如果f'不同于f,则该防御策略优于原始防御策略f。
[0059]
采用上述技术方案带来的有益效果:
[0060]
本发明一方面通过调配现有的移动防御资源形成防御策略使攻击方的攻击效益降至最低,另一方面实时改进防御策略,使其对受约束的攻击方更具鲁棒性,同时保持防御对无约束攻击方的预期效益不变,具有一定的实用价值。
附图说明
[0061]
图1为本发明的步骤流程图;
[0062]
图2为移动变电站的保护范围表示图;
[0063]
图3为子区间分析法原理图。
具体实施方式
[0064]
以下将结合附图,对本发明的技术方案进行详细说明。本发明公开了一种基于多移动防御资源和移动目标的新型变电站安全保护方法,如图1所示,具体步骤如下:
[0065]
搭建攻击方-防御方stackelberg博弈模型,包括攻击方策略模型、防御方策略模型,考虑巡护车的速度限制约束、保护半径约束,以及移动变电站的时空约束等,进而形成一种包含多移动防御资源和移动目标的攻击方-防御方stackelberg博弈模型。
[0066]
对于多移动防御资源和移动目标的攻击方-防御方策略有如下说明:1)防御方采用混合策略,攻击方在观察并评估该混合策略后做出最佳响应。攻击方的计划是离线决定的,即攻击方在执行攻击时不考虑移动防御资源当前的部分路线,仅考虑发起攻击时间点时移动防御资源的位置;2)攻击方可以在目标移动过程中的任何时间点发起攻击,从而形成一套连续的策略。防御方可以部署一组移动防御资源来保护这些目标。需要注意的是本模型设定攻击方一次只能对一个目标发动攻击;3)此博弈模型属于零和博弈,一方获得收益一定建立在另一方遭到损失的基础上。防御方需要调度移动防御资源来最小化攻击方的预期效用;4)攻击方对某一目标发动攻击获得的预期效用根据目标的位置和时间变化,目标的移动安排是固定的。
[0067]
进攻方需要选择在合适的时间对特定的目标发动攻击以获得最大的预期效用,进
攻方策略模型描述如下:
[0068]
atteuf(fq,t)=1-cgωf(fq,t)uq(t),cg∈[0,1]
[0069]
<q,t>
[0070]
式中,atteuf(fq,t)表示当防御方的混合策略为f时攻击者在时间t攻击目标fq的预期效用;cg表示保护的强度,即巡护车能成功阻止攻击者的概率,下标g表示处在攻击目标保护范围内的巡护车数量;ωf(fq,t)表示在时间t巡护车能保护目标fq的可能性;uq(t)是时间t的分段线性函数,表示攻击者在时间t对某一移动变电站fq发动一次成功攻击所能得到的收益;策略函数<q,t》中q和t分别表示是攻击目标的编号和攻击时间。
[0071]
防御方需要采取合适的策略f来调配有限的防御资源来将进攻者的最大预期效用降至最低,防御方策略模型描述如下:
[0072][0073][0074]ru
:t
→d[0075]
式中,defeuf表示防御方的预期效用;f表示防御方采取的混合策略,最优防御策略是一种策略f,使得最小。ru表示编号为u巡护车的时间位置关系,t和d分别代表一个连续的时间域和一个连续的空间域。
[0076]
防御方调用的移动防御资源巡护车有着运行速度约束以及保护范围约束,受保护目标移动变电站遵循着时空约束,按照特定的规划安排移动,上述约束具体描述如下:
[0077]
v≤vm[0078]
0≤r≤re[0079]
sq:t
→d[0080]
式中v表示巡护车的速度,vm表示巡护车的速度上限;r表示巡护车的保护范围,re表示巡护车的保护范围上限;sq是分段线性的,表示编号为q的移动变电站的时间位置关系;t和d分别代表一个连续的时间域和一个连续的空间域。
[0081]
将原来连续的时间离散为均匀分布的m个点t={t1,t2,...,tm},用δ
t
表示两个相邻时间点间的间隔,并设定δ
t
足够小以保证在任意时间段[tk,t
k+1
]上对于任何目标fq,sq和uq(t)是线性的。同时用一组点d={d1,d2,...,dm}将巡护车以及移动变电站的移动路线离散化,并规定每个巡护车在任何离散化时间点tk只能停留在离散化的某个点di上,此时一台巡护车的路径可以表示为向量
[0082][0083]
式中ru(k)表示巡护车在时间tk时停留的离散点的编号,路径ru表示巡护车在时间段[tk,t
k+1
]内从点移动到路径ru确定时,边也随之固定,选择边e
i,j,k
的总概率是所有起点为ru(k)=i、终点为ru(k+1)=j的路线ru概率总和,定义流f(i,j,k)具体表述如下:
[0084][0085]
式中p(ru)是采取路径ru的概率,f(i,j,k)表示在时间tk巡护车从位置di出发并在
时间t
k+1
时移动到位置dj的概率。
[0086]
定义g=(v,e),其中顶点集v对应于巡逻者可能在t中离散化时间点处的位置,e是巡护车可以采取的可行边集。如图2所示,在时间段[tk,t
k+1
]中,移动变电站fq从sq(tk)移动至sq(t
k+1
),其保护范围可以表示为一个斜圆柱。当巡护车从顶点v1移动到顶点v2的巡逻路线与这个斜圆柱产生重叠时,移动变电站fq受到保护。进一步的可以得到移动变电站fq的保护范围具体表述如下:
[0087]
βq(t)={v=(x,y):||v-sq(t)||≤re}
[0088]
式中βq(t)表示t时刻移动变电站fq的保护范围,当巡护车处在这个保护范围内时,目标处于被保护状态;sq(t)表示移动变电站fq在t时刻所处的位置;re表示巡护车的最大保护半径。
[0089]
如图3所示,进一步的将时间段(tk,t
k+1
)划分为子区间其中r=0,...,m
qk
,设置,设置表示距离变电站fq的移动路线sq保护极限re的边界与巡护车可能选择的边e
i,j,k
对于任何时间间隔(tk,t
k+1
)产生的时间交点,m
qk
是交点的总数。在上述的时间交点上可能出现巡护车离开或进入保护范围的情况,如图3中的和当攻击方选择在巡护车离开保护范围的时间交点上发动攻击时,可以取得较大的预期效用,由于在每个子区间上,进攻方发动攻击获得的收益uq(t)是时间t的线性函数,因此在任意一个子区间上,进攻方的最大预期效用可以表示为
[0090][0091]
式中和分别表示atteuf在子区间两侧的极限。
[0092]
进一步得到可以表示为一个线性规划问题的计算连续攻击者策略空间情况下极大极小解的求解器,具体描述如下:
[0093][0094][0095][0096][0097][0098][0099]
[0100][0101][0102]
式中z是攻击者预期效用的最大值;f(i1,j1,...,iw,jw,k)表示第一台巡护车在时间tk到t
k+1
期间从移动到第二台巡护车在时间tk到t
k+1
期间从移动到以此类推所得的第w台巡护车在时间tk到t
k+1
期间从移动到的联合概率;p(i1,...,iw,k)表示在时间tk时,第一台巡护车在第二台巡护车在以此类推第w台巡护车在的联合概率;表示节点和在二维空间中的欧几里德距离;vm表示巡护车的速度上限;δ
t
表示两个相邻离散时间点的间隔;和分别表示atteuf在子区间两侧的极限;i(iu,q,k)表示tk时能保护目标q的巡护车数量;cq表示保护强度。
[0103]
求解得到策略f,该策略有效的将攻击方的预期效用降至最低。然而上述求解建立在攻击方不受任何约束,能够在任意时间点对任意目标发动攻击以获得最大的预期效用的前提下。当攻击方受到了一定的约束,比如只能在某个时间段内发动进攻,此时上述求解得到的策略f可能并不能达到最优效果。因此需要通过改进防御方策略,使其对受约束的攻击者更具鲁棒性,同时保持防御方对无约束攻击者的预期效用不变。如果可以到新的防御策略f'使得对于任何攻击方策略《q,t》,防御方在f'下的预期效用大于或等于在f下的预期效用,并且对于至少一个特定的攻击方策略,防御方在f'下的预期效用严格大于f下的预期效用,此时可以称策略f'优于策略f,表达式如下:
[0104]

[0105]
式中defeuf(fq,t)表示防御方在策略f下的预期效用;defeu
f'
(fq,t)表示防御方在策略f'下的预期效用。
[0106]
利用路径调整法求解攻击方受约束情况下的最优策略具体描述如下:
[0107]
(i)首先通过迭代查包含最小概率边的路径,将f分解为多条路径;初始化剩余流分布路径集s=φ,和路径上的概率分布。当时设令并寻任意以使得和(即在路径里)且将添加到路径集s并设若且设
[0108]
(ii)然后逐一调整s中的每条路径,以获得一组新的路径集s'和相应的新概率分布p'。初始化新路径集s'=φ,新概率分布当s≠φ时,
[0109]
从s中挑选一条路径ru,调整ru以得到新路径r
u'
:对于给定的ru和k
*
,若k≠k
*
,那么设置ru;(k)=ru(k)。设置r
u'
(k
*
)=i0以使e(u1,k
*-1)和e(u1,k
*
)达到速度限制,当选择i0时ru'
优于ru,r
u'
不受具有任何其他i0选择的路径支配。如果不存在这样的i0,设置r
u'
(k
*
)=ru(k
*
),添加ru到路径集s'并设置p'(r
u'
)=p(ru)。最后将ru从路径集s中移除。
[0110]
(iii)从s'和p'重建新的缩减表示f'。
[0111]
此时得到了一个新的防御策略f',如果f'不同于f,则该防御策略优于原始防御策略f。
[0112]
本发明可以很好地求解防御方最优防御策略,从而指导调配有限的防御资源将攻击方的预期效用降至最低,具有一定的工程实用价值。
[0113]
实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

技术特征:


1.一种基于多移动防御资源和移动目标的新型变电站安全保护方法,其特征在于,包括以下步骤:s1、建立包含多移动防御资源和移动目标的攻击方-防御方stackelberg博弈模型,攻击方具有连续的策略空间,防御方具有离散化的策略空间;s2、使用缩减表示法表示防御方混合策略,利用子区间分析法构建攻击方的连续策略,结合防御方混合策略和攻击方的连续策略得到计算连续攻击方策略空间情况下的极大极小解的求解器,用于求解最优防御策略;s3、基于步骤s1的多移动防御资源和移动目标的攻击方-防御方stackelberg博弈模型结合步骤s2求解所得的防御方、攻击方策略情况,通过路径调整法,对步骤s2所生成防御策略进行比较更新;s4、部署移动防御资源,防御方根据步骤s3中更新后的防御策略部署移动防御资源保护移动变电站。2.根据权利要求1所述一种基于多移动防御资源和移动目标的新型变电站安全保护方法,其特征在于,步骤s1中,防御方采用混合策略,攻击方在观察并评估该混合策略后做出响应;攻击方在执行攻击时不考虑移动防御资源当前的部分路线,仅考虑发起攻击时间点时移动防御资源的位置;攻击方在目标移动过程中的任何时间点发起攻击,从而形成一套连续的策略;防御方部署一组移动防御资源来保护这些目标;本模型设定攻击方一次只能对一个目标发动攻击;博弈模型属于零和博弈,一方获得的收益建立在另一方遭到损失的基础上;防御方需要调度移动防御资源来最小化攻击方的预期效用;攻击方对某一目标发动攻击获得的预期效用根据目标的位置和时间变化,目标的移动安排是固定的。3.根据权利要求1所述一种基于多移动防御资源和移动目标的新型变电站安全保护方法,其特征在于,步骤s1具体指:构建攻击方策略模型,表征攻击方的预期效用及策略函数;构建防御方策略模型,表征防御方的预期效用及策略函数;构建约束条件,包括:移动防御资源的速度限制约束条件,移动防御资源的保护半径约束条件,移动变电站的时间约束条件和空间约束条件。4.根据权利要求3所述一种基于多移动防御资源和移动目标的新型变电站安全保护方法,其特征在于,所述攻击方策略模型公式表达如下:atteu
f
(f
q
,t)=1-c
g
ω
f
(f
q
,t)u
q
(t),c
g
∈[0,1]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)<q,t>
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)式中,atteu
f
(f
q
,t)表示当防御方的混合策略为f时攻击方在时间t攻击目标f
q
的预期效用;c
g
表示保护的强度,即移动防御资源能成功阻止攻击方的概率,下标g表示处在攻击目标保护范围内的移动防御资源数量;ω
f
(f
q
,t)表示在时间t移动防御资源能保护目标f
q
的可能性;u
q
(t)是时间t的分段线性函数,表示攻击方在时间t对某一移动变电站f
q
发动一次成功攻击所能得到的收益;策略函数<q,t>中q和t分别表示是攻击目标的编号和攻击时间。
5.根据权利要求3所述一种基于多移动防御资源和移动目标的新型变电站安全保护方法,其特征在于,所述防御方策略模型公式表达如下:法,其特征在于,所述防御方策略模型公式表达如下:r
u
:t

d
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)式中,defeu
f
表示防御方的预期效用;f表示防御方采取的混合策略,最优防御策略是一种策略f',使得最小;r
u
表示编号为u移动防御资源的时间位置关系,t和d分别代表一个连续的时间域和一个连续的空间域。6.根据权利要求1所述一种基于多移动防御资源和移动目标的新型变电站安全保护方法,其特征在于,移动防御资源的速度限制约束、保护半径约束、移动变电站的时间和空间约束条件公式表达如下:v≤v
m
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)0≤r≤r
e
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)s
q
:t

d
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)式中,v表示移动防御资源的速度,v
m
表示移动防御资源的速度上限;r表示移动防御资源的保护范围,r
e
表示移动防御资源的保护范围上限;s
q
表示编号为q的移动变电站的时间位置关系并且s
q
是分段线性的;t和d分别代表一个连续的时间域和一个连续的空间域。7.根据权利要求1所述一种基于多移动防御资源和移动目标的新型变电站安全保护方法,其特征在于,步骤s2中使用缩减表示法表示防御方混合策略具体指:将连续的时间离散为均匀分布的m个点t={t1,t2,...,t
m
},用δ
t
表示两个相邻时间点间的间隔,并设定δ
t
足够小以保证在任意时间段[t
k
,t
k+1
]上对于任何目标f
q
,s
q
和u
q
(t)是线性的;同时用一组点d={d1,d2,...,d
m
}将移动防御资源以及移动变电站的移动路线离散化,并规定每个移动防御资源在任何离散化时间点t
k
只能停留在离散化的某个点d
i
上,此时一台移动防御资源的路径公式表达如下:式中r
u
(k)表示移动防御资源在时间t
k
时停留的离散点的编号,路径r
u
表示移动防御资源在时间段[t
k
,t
k+1
]内从点移动到路径r
u
确定时,边也随之固定,选择边e
i,j,k
的总概率是所有起点为r
u
(k)=i、终点为r
u
(k+1)=j的路线r
u
概率总和,定义流f(i,j,k)公式表达如下:式中p(r
u
)是采取路径r
u
的概率,f(i,j,k)表示在时间t
k
移动防御资源从位置d
i
出发并在时间t
k+1
时移动到位置d
j
的概率。8.根据权利要求1所述一种基于多移动防御资源和移动目标的新型变电站安全保护方法,其特征在于,步骤s2中利用子区间分析法精确建模攻击方的连续策略具体指:将任意时间段(t
k
,t
k+1
)划分为子区间其中r=0,...,m
qk
,设置,设置表
示距离变电站f
q
保护极限r
e
的边界范围与边e
i,j,k
对于任何目标f
q
和任何时间间隔(t
k
,t
k+1
)产生的时间交点,m
qk
是交点的总数;定义g=(v,e),其中顶点集v对应于移动防御资源可能在t中离散化时间点处的位置,e是移动防御资源可以采取的可行边集;则移动变电站f
q
的保护范围公式表达如下β
q
(t)={v=(x,y):||v-s
q
(t)||≤r
e
}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)式中,β
q
(t)表示t时刻移动变电站f
q
的保护范围;s
q
(t)表示移动变电站f
q
在t时刻所处的位置;r
e
表示移动防御资源的最大保护半径;进攻方的最大预期效用公式表达如下:式中,和分别表示atteu
f
在子区间两侧的极限。9.根据权利要求1所述一种基于多移动防御资源和移动目标的新型变电站安全保护方法,其特征在于,步骤s2中,计算连续攻击方策略空间情况下的极大极小解的求解器公式表达如下:达如下:达如下:达如下:达如下:达如下:达如下:达如下:达如下:式中z是攻击方预期效用的最大值;f(i1,j1,...,i
w
,j
w
,k)表示第一台移动防御资源在时间t
k
到t
k+1
期间从移动到第二台移动防御资源在时间t
k
到t
k+1
期间从移动到以此类推所得的第w台移动防御资源在时间t
k
到t
k+1
期间从移动到的联合概率;p(i1,...,i
w
,k)表示在时间t
k
时,第一台移动防御资源在第二台移动防御资源在以此类推第w台移动防御资源在的联合概率;表示节点和在二维空间中的欧
几里德距离;v
m
表示移动防御资源的速度上限;δ
t
表示两个相邻离散时间点的间隔;atteu
f
(f
q
,t
k
)表示当防御方的混合策略为f时攻击方在时间t
k
攻击目标f
q
的预期效用;和分别表示atteu
f
在子区间两侧的极限,其中r=0,...,m
qk
,设置,设置,设置表示距离变电站f
q
保护极限r
e
的边界范围与边e
i,j,k
对于任何目标f
q
和任何时间间隔(t
k
,t
k+1
)产生的时间交点,m
qk
是交点的总数;;ω
f
(f
q
,t
k
)表示在时间t
k
移动防御资源能保护目标f
q
的可能性;u
q
(t
k
)表示攻击方在时间t
k
对某一移动变电站f
q
发动一次成功攻击所能得到的收益;i(i
u
,q,k)表示t
k
时能保护目标q的移动防御资源数量;c
q
表示q台移动防御资源的保护强度。10.根据权利要求1所述一种基于多移动防御资源和移动目标的新型变电站安全保护方法,其特征在于,步骤s3中路径调整法考虑到求解过程建立在攻击方不受任何约束,能够在任意时间点对任意目标发动攻击以获得最大的预期效用的前提下;当攻击方受到了一定的约束;此时求解得到的策略f并不能达到最优效果;因此需要通过改进防御方策略,使其对受约束的攻击方更具鲁棒性,同时保持防御方对无约束攻击方的预期效用不变;当到新的防御策略f'使得对于任何攻击方策略<q,t>,防御方在f'下的预期效用≥在f下的预期效用,并且对于至少一个特定的攻击方策略,防御方在f'下的预期效用严格大于f下的预期效用,此时称策略f'优于策略f,表达式如下:式中defeu
f
(f
q
,t)表示防御方在策略f下的预期效用;defeu
f'
(f
q
,t)表示防御方在策略f'下的预期效用;路径调整法具体表示如下:s31、先通过迭代查包含最小概率边的路径,将f分解为多条路径;初始化剩余流分布路径集s=φ,和路径上的概率分布;当时设令并寻任意以使得和(即在路径里)且将添加到路径集s并设若且设s32、逐一调整s中的每条路径,以获得一组新的路径集s'和相应的新概率分布p';初始化新路径集s'=φ,新概率分布当s≠φ时,从s中挑选一条路径r
u
,调整r
u
以得到新路径r
u'
:对于给定的r
u
和k
*
,若k≠k
*
,则设置r
u;
(k)=r
u
(k);设置r
u'
(k
*
)=i0以使e(u1,k
*-1)和e(u1,k
*
)达到速度限制,当选择i0时r
u'
优于r
u
,r
u'
不受具有任何其他i0选择的路径支配;如果不存在这样的i0,设置r
u'
(k
*
)=r
u
(k
*
),添加r
u
到路径集s'并设置p'(r
u'
)=p(r
u
);最后将r
u
从路径集s中移除;s33、从s'和p'重建新的缩减表示f'此时得到一个新的防御策略f',如果f'不同于f,则该防御策略优于原始防御策略f。

技术总结


本发明公开了一种基于多移动防御资源和移动目标的新型变电站安全保护方法,目的是通过调用有限的移动变电站防御资源来防范恶意攻击,将损失降至最低。该方法建立了包含多移动防御资源和移动目标的攻击方-防御方Stackelberg博弈模型,考虑了防御、攻击双方策略空间的特性,使用缩减表示法表示防御方的混合策略,并以子区间分析法精确建模攻击方的连续策略,进而提出了高效的基于线性规划的解决方案。在获得解决方案的基础上,通过路径调整法对生成的解决方案进行比较更新来提高防御方混合策略的鲁棒性。本发明能够有效的降低攻击方的预期收益,降低损失,具有一定的工程使用价值。用价值。用价值。


技术研发人员:

韩海腾 曹阳 魏恬恬 臧海祥 孙国强 卫志农

受保护的技术使用者:

河海大学

技术研发日:

2022.09.21

技术公布日:

2022/12/23

本文发布于:2024-09-25 01:16:35,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/47235.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:策略   时间   变电站   资源
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议