混合策略纳什均衡计算

混合策略纳什均衡计算
为了了解博弈论中引⼊“混合策略”概念的动机,我们来看⽤“划线法”对相当简单的“猜谜博弈”求解的结果,其结果如图8.3.1所⽰。
求解的答案是,在纯策略意义下“猜谜博弈”⽆解,即不存在在纯策略意义下的纳什均衡,也就是说,这个博弈得不到⼀个平衡稳定的结局。但经验告诉我们,两个⼉童玩这样的猜谜游戏,⼀局难定胜负,⼀次⼜⼀次地玩下去,随机地出⼀个⼿指,或者两个⼿指,多次以后,基本胜负各半,也就是有了⼀个平衡的结果。这个启⽰是,若⼀个博弈在纯策略意义下没有平衡的结局,但两个局中⼈各⾃将⾃⼰的全部策略随机地组织起来,且可能得到平衡的结局,换⾔之,在概率策略的意义下可能存在纳什均衡。正是这样的思考,引发了“混合策略”的概念。东京国际动漫节
⼀、混合策略
1.混合策略的定义
设Ⅰ与Ⅱ是⼀个博弈的两个局中⼈。他们的纯策略集(c8.2)分别记为:
龙生九子各有所好
S={s1,s2,…s n}和T={t1,t2, …t m}        (8.3.1)
x与y是两个概率向量,即:
x=(x1,x2, …x n)T;xi≥0(i=1,2, …n);∑x i = 1
y=(y1,y2, …y m)T;yj≥0(j=1,2, …m);∑y j = 1
若 x表⽰对局中⼈Ⅰ的纯策略集S的全体策略的⼀种概率选择;y表⽰对局中⼈Ⅱ的纯策略集T的全体策略的⼀种概率配置,即:
Ⅰ以概率x1选择策略s1,以概率x2选择策略s2,……以概率x n选择策略s n。
Ⅱ以概率y1选择策略t1,以概率y2选择策略t2,……以概率y m选择策略t m。
则称x为局中⼈Ⅰ的混合策略;称y为局中⼈Ⅱ的混合策略。
混合策略的实践意义是表⽰局中⼈对各个纯策略的偏好程度,或是对多次博弈达到均衡结局的各个纯策略选择的概率估计,因此体现了主观概率的意义。
2.混合策略集
根据混合策略的定义,易见,纯策略可视为特殊的混合策略。例如局中⼈Ⅰ的⼀个纯策略策略s i∈S 就是特殊的混合策略x' :此概率向量的分量取值为:
x'i=1 ,x'j=0        (j≠i)
也就是Ⅰ选择策略s1的概率为0(不妨设i≠1),……选择策略s i的概率为1,……选择策略s n的概率为0(不妨设i≠n)。有了这个见解,后⽂中,我们将记:
X={x∈R n| x=(x1,x2, …x n)T;x i≥0(i=1,2, …n); ∑x i = 1}; (8.3.2)
Y={y∈R m| y=(y1,y2, …y m)T;y j≥0(j=1,2, …m);∑y j = 1}。 (8.3.3)
并称:X为局中⼈Ⅰ的策略集或混合策略集。Y为局中⼈Ⅱ的策略集或混合策略集。以及(x, y) ∈X×Y为博弈的混合策略结局。
注意到纯策略集S是⼀个有限集,由它⽣成的凸集,也就是单纯形(参阅第⼆章有关内容)可表⽰为:
可见,混合策略集X与纯策略集S⽣成的凸集(单纯形)1-1对应(在数学上称为同构),因此可以把混合策略集X“看成”由纯策略集S拓展的凸集(单纯形),⽽且集S是集X的极点⼦集。同理可以把混合策略集Y“看成”由纯策略集T拓展的凸集(单纯形),⽽且集T是集Y的极点⼦集。按照这样的理解,就不难把握混合策略的概念,即每⼀个混合策略x表⽰了由全部纯策略s i∈S以凸组合⽅式产⽣的⼀个策略。
3.混合策略结局的盈利函数
设博弈的局中⼈Ⅰ与Ⅱ各⾃的纯策略集S和T,以及各⾃的混合策略集X、Y分别由式(8.3.1)、式(8.3.2)和式(8.3.3)定义。博弈的盈利矩阵模型为:
我们定义局中⼈Ⅰ的盈利矩阵为:
定义局中⼈Ⅱ的盈利矩阵为:
则定义混合策略结局的盈利函数如下:
(1) 任取s i∈S,任取y∈Y,定义结局(s i, y)的盈利函数为:
(8.3.4)
(2) 任取t j∈T,任取x∈X,定义结局(x, t j)的盈利函数为:
(8.3.5)
(3) 任取x∈X,任取y∈y,定义结局(x, y)的盈利函数为:
(8.3.6)
(8.3.7)
将式(8.3.6)给出的u1(x,y)的定义与(8.3.4)给出的u1(s i,y)的定义作联系分析,以及将式(8.3.7)给出的u2(x,y)的定义与(8.3.5)给出的u2(x,t j)的定义作联系分析,容易得出u1(x,y)以及u2(x,y)有下列等价的表达式:
(8.3.9)
(8.3.10)
⼆、混合策略的纳什均衡
(⼀)混合策略纳什均衡的概念
1、混合策略纳什均衡的定义
设博弈的局中⼈Ⅰ与Ⅱ各⾃的纯策略集S和T,以及各⾃的混合策略集X、Y分别由式(8.3.1)、式(8.3.2)和式(8.3.3)定义。
若⼀个混合策略的结局(x, y)∈X×Y满⾜下列条件:欧尚宜家
(1)        (8.3.11)
(2)        (8.3.12)
则称混合策略的结局(x, y)是纳什均衡。
2、混合策略纳什均衡的含义
因为可以把混合策略集X“看成”以纯策略集S为极点⼦集⽽拓展的凸集(单纯形)。因此根据定义在凸集上的函数(称为凸函数)的性质,可以证明,若式(8.3.11)成⽴,则下式也必然成⽴:
(8.3.13)
类似地,若式(8.3.12)成⽴,则下式也必然成⽴:
(8.3.14)
式(8.3.13)及式(8.3.14)表⽰。x是局中⼈Ⅰ对局中⼈Ⅱ选择了策略y后的最优策略(条件盈利最⼤),以及y是局中⼈Ⅱ对局中⼈Ⅰ的选择了策略x后的最优策略(条件盈利最⼤)。
由于在博弈中局中⼈Ⅰ和局中⼈Ⅱ都选择“理性”⾏动,这样双⽅的博弈将在结局(x, y)下达到均衡状态。
[例8.3.1]  验证x=(1/2, 1/2)T , y=(1/2, 1/2)T构成的混合策略结局(x, y)是“猜谜博弈”的纳什均衡。
解  “猜谜博弈”的模型是:
纯策略集S={1,2}(即{出⼀指,出两指}),纯策略集T={1,2}。由式(8.3.4)、式(8.3.5)、式(8.3.6)和式(8.3.7)。
因此下列不等式成⽴
由式(8.3.8)和式(8.3.8)知,混合结局(x, y)是“猜谜博弈”的纳什均衡。n 二甲基亚硝胺
(⼆)”2策略博弈“的求纳什均衡的⽅法
[定理8.3.1]
若博弈的局中⼈Ⅰ与Ⅱ各⾃的纯策略集S和T都是2策略集:
S={s1,s2 }和T={t1,t2 }
则混合策略结局(x, y)是纳什均衡的充要条件是:
(8.1.15)
(8.1.16)
证明可设:
先证必要性,设(x, y)是纳什均衡。由式 (8.3.9)
由纳什均衡的含义,混合策略x是局中⼈Ⅰ在预测对局中⼈Ⅱ选择y 下的最优策略,因此由:
燃烧海洋上的海盗
商人论坛
再正充分性,设u1(s1,y)=u1(s2,y),则
同理可得:
从⽽由纳什均衡的定义式(8.3.11)和式(8.3.12)可知(x, y)是纳什均衡。    [例8.3.2] 求图8.3.2给出的博弈的纳什均衡。
解由式(8.3.4)
由式(8.3.15 )的要求解
2q-1=0
∴        q=1/2
由式(8.3.5)
由式(8.3.16 )的要求解
故求得纳什均衡
三、混合策略纳什均衡的两则应⽤

本文发布于:2024-09-20 15:22:41,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/600724.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:策略   混合策略   概率   结局   博弈
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议