第三章 最佳对策与纳什均衡

第三章纳什均衡
第二章通过划线法和箭头法出的具有稳定性的策略组合,不管是否唯一,都有一个共同的特性,就是其中的每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳对策。在两方博弈的情况下,就是“给定你的策略,我的策略是我最好的策略;给定我的策略,你的策略也是你的最好的策略”。事实上,具有这种性质的策略组合,正是非合作博弈理论中最重要的一个概念,即博弈中的“纳什均衡”。本节要对这个概念的定义、部分重要性质和它在博弈分析中的作用等,进行一些讨论。
§3-1 纳什均衡的定义(P-52)
因为纳什均衡在非合作博弈分析中具有十分关键的作用和地位,因此有必要给出它的一个较正式的定义。
文化氛围
定义:在一个博弈对局中,如果由各个博弈方策略空间的某一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略的组合的最佳对策,则称这个策略组合为该博弈的一个“纳什均衡”。
换言之,纳什均衡是这样一种状态,在该状态下每个参与方所采取的策略都是对于其他参与方的策略的最优反应。以二人博弈为例,纳什均衡就是一个策略组合(甲的策略,乙的策略),甲的策略是对乙的策略的最优反应,而乙的策略也是对甲的策略的最优反应。譬如,在囚徒困境博弈中,我们说(甲供认,
乙供认)是一个纳什均衡,就因为它满足纳什均衡定义所要求的特性——甲供认是对乙供认的最优反应,而乙供认是对甲供认的最优反应。
换言之,在纳什均衡状态下,所有参与人都已选取其最优反应。既然如此,我们就可以通过判断一个策略组合中的策略是否满足成为彼此的最优反应来确认它是否是纳什均衡。
囚徒困境中存在优势策略纳什均衡(两个人都选取优势策略),智猪博弈中有反复剔除劣势策略纳什均衡(一人有优势策略,另一人没有)。但是,在很多的博弈中,所有参与人都没有优势策略(也就不可能有劣势策略)。这种情况下,我们应如何求解它的纳什均衡呢?
1、麦琪的礼物
故事模型
麦琪的礼物“博弈改编自欧·亨利的同名小说。小说写的是这样一个故事:一对经济拮据的夫妻,丈夫吉姆有一只爱不释手的怀表,却没有表链;而妻子有一头美丽的长发,却缺少一把玳瑁梳子。他俩感情深厚,生活得美满知足。在圣
诞节前夕,俩人分别悄悄外出为方购买礼物。结果妻子剪卖自己的长发,为先生买了条表链,好配他的怀表;而丈夫则卖了怀表,为妻子买了一把梳子。
把这个故事转化成博弈模型可以表示为图3-1:
妻子
剪发 不剪
丈夫
卖表
不卖
图3-1 麦琪的礼物
表中的数字是这样设计出来的:
● 如果丈夫卖了表而妻子剪了发,则他们的礼物对对方都没有价值,他们各自得到效用0;
● 如果丈夫不卖表而妻子不剪发,则他们都没有钱买礼物送给对方,仍各自得到效用0;
● 如果丈夫卖表而妻子不剪发,或者丈夫不卖表而妻子剪发,则他们中有一方可买礼物送给对方,因为他们如此相爱,送礼方可得到2个单位效用,受礼方可得到1个单位效用。
这个博弈的稳定结果(或者说均衡)是什么呢?我们可以通过前面介绍的划线法和箭头法,来求解该博弈的纳什均衡为(不卖表,剪发)和(卖表,不剪发),如图3-2。
妻子
剪发 不剪
丈夫
卖表
不卖
婴幼儿营养与保健
图3-2  麦琪的礼物
2、电视频道的性别战 故事模型
多维度
有一对夫妻,丈夫喜欢看足球赛节目,妻子喜欢看肥皂剧节目,但是家里只有一台电视,于是就产生了争夺频道的矛盾。假设双方都同意看足球赛,则丈夫可得到2单位效用,妻子得到1单位效用;如果都同意看肥皂剧,则丈夫可得到1单位效用,妻子得到2单位效用;如果双方意见不一致,结果只好大家都不看,各自只能得到0单位效用。
这个博弈的策略式表达如图3-3:
妻子
足球赛 肥皂剧
丈夫
足球赛
愈慢愈美丽
肥皂剧
图3-3 性别战:电视频道争夺
防老剂dnp可以用画线法求解该博弈的纳什均衡,均衡结果是(足球赛,足球赛)和(肥皂剧,肥皂剧)。这个博弈的一个典型特征是,如果对方一意坚持,则顺从对方比与对方抗争要好。一方坚决选择自己喜欢的节目时,顺从至少可以得到1单位效用,而抗争则只能得到0单位效用。这与现实中的故事是一致的,夫妻双方一方坚持己见的时候,另一方常常会迁就一些,做出让步。
性别战博弈具有与麦琪的礼物相同的博弈结构。该博弈结构的显著特点是,博弈有两个均衡,博弈双方各自会偏爱一个均衡,比如丈夫偏爱(足球赛,,足球赛)均衡,而妻子偏爱(肥皂剧,肥皂剧)均衡;不过他们还是有一些共同利益的,因为任何一个均衡中,他们都可以得到比非均衡状态更多的赢利。
在性别战中,究竟哪一个均衡会出现呢?也许这取决于夫妻俩在家庭中的地位,如果什么都是丈夫说了算,那么很可能出现丈夫偏爱的均衡;或者也可能出现轮流做主的情况。但更多的时候,在性別战博弈中建立一个强硬的形象也许是有好处的。
3、铁腕上司与鹰派下属
性别战博弈的一个现实例子是组织中上下级的博弈。所有在层级组织中工作的人们都知道,组织中的上下级关系是很微妙的。有些组织中上级对待下属非常强硬,被称为铁腕上司;有些组织里下级对待上级毫不买账,被称为鹰派下属。假设一个上司和其下属进行博弈,他们在某个有争议的题上各自都
可以选择对彼此的强硬态度和屈从态度,相关的赢利情况如图3-4:
下属
强硬 屈从
上司
强硬
唐璜作者屈从
图3-4 组织中的政治行为
画线法不难发现,这个博弈中的纳什均衡是(强硬,屈从)和(屈从,硬)。如果上司强硬,则下属应屈从;如果下属强硬,上司最好屈从。这与通常所看到的组织中的状况是一样的,如果上司态度坚决,下属只好全;如果下属完全不买账,上司只好做出一些让步。
这个博弈对我们有什么启示呢?在这个博弈中,如果上司树立起了铁腕上司
的形象,他就可能从中获得好处。一个粗暴的、不近人情的上司往往令员工更为畏惧,而不敢与其针锋相对,那么均衡的结果很可能是(强硬,屈从)。反过来,如果一个下属素有鹰派下属形象,那么上司往往也兔会让其三分,均衡结果很可能是(屈从,强硬)。
当然,读者朋友也许会说,铁腕上司是常见的,鹰派下属似乎不大常见啊。其实不然,组织中上司被架空权力的现象并不鲜见,在一些政治组织中尤其如此。有些政治组织的领袖以残暴的铁腕著称;有些政治组织的领袖却只是一个傀儡而已。
4、懦夫博弈 故事模型
两个司机在一个可能彼此相撞的过程中相向开车向前。每个人可以在相撞前转向一边而避免相撞,但这将使他被视为“懦夫”;他也可以选择继续向前——如果两个人都向前,那么就会出现车毁人伤的局面;但若一个人转向而另一个人向前,那么向前的司机将成为“勇士”。
我们把他们在各种情况下所得到的收益赋予一定效用值,如图3-5:
司机乙
转向 向前
司机甲
转向
向前
图3-5 懦夫博弈
懦夫博弈虽然是我们构造出的例子,但是跟我们现实中的有些问题是类似的。比如,两辆相向行使的车狭路相逢,互相都不让道的情况。从博弈的赢利结构来看,应该说双方采取一种合作态度——至少是部分的合作态度选择转向可能是有利的。但是使用画线法求解我们立即可以得到,(转向,转向)不是纳什均衡结果。纳什均衡结果将是(向前,转向)和(转向,向前)。即是说,均衡结果将是一个司机向前,另一个司机转向避让。
懦夫博弈有着与性别战博弈不同的结构特征,那就是如果一方坚持要进行博弈,那么另一方就难以退出博弈(退出博弈也会被视为“懦夫”)形成了骑虎难下的局面。而此时,冒险选择向前而获胜的一方,将自己幸福建立在了对方的痛苦之上。假定博弈参与的一方是鲁莽、不顾后果人,另一方是足够理性的人,那么鲁莽者极可能是博弈的胜出者。如果这种懦夫博弈进行多次,则冒险选择向前而成功的参与人就更有信心在将采取这种策略,他很可能会树立起一种粗暴的形象使得对手在未来的对局中
害怕从而获得好处。
§3-2 纳什均衡的一致性预测性质
1、性质内容
如果所有博弈方都预测一个特定的博弈结果必定出现;那么所有的博弈方都不会选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的行为愿望,因此这个预测结果最终真会成为博弈的结果。也就是说,这里“一致预测”中“一致”的意义是,各博弈方的实际行为选择必定会与他们的预测结果一致,而不会选择与预测结果相反的行为。
2、性质应用的两个定理
定理1:
在n个博弈方的博弈G={S1,…,S n;u1,…,u n}中,如果严格下策反复剔除法排除了除(S1﹡,…,S n﹡)之外的所有策略组合,那么(S1﹡,…,S n﹡)一定是该博弈唯一的纳什均衡。
定理2:
在n个博弈方的博弈G={S1,…,S n;u1,…,u n}中,如果(S1﹡,…,S n﹡)是G的一个纳什均衡,那么严格下策反复剔除法一定不会将它消去。
§3-3 聚点均衡
非数理博弈论专家托马斯·谢林认为,在现实生活中,博弈参与人可以使用某些被博弈模型抽象掉的信息来达到一个聚点均衡。某个点之所以成为“聚点”,是因为博弈各方的文化和经验使他们相信这个点是大家都容易想到的、习惯选择的点。譬如我们讲到的懦夫博弈中,如果司机甲是鲁莽者,司机乙更理智,这个信息双方都清楚,那么司机甲“向前”而司机乙“转向”就会是一个聚点均衡。在图5-5的组织中的政治行为博弈中,如果上司是铁腕派,而下属是温和派,那么可以推测(强硬,屈从)就是一个聚点均衡。
如果博弈重复多次,则过去的历史常常就规定了聚点之所在。我所在的学院每到周二下午就开会,大家在会议室的座位本来是不固定的,但是大家在每学期第一次会议时所坐的位置,基本上会在这个学期保持不变,因为每次开会时大家就会习惯性如同产生了聚点一样。新婚夫妻的家务分担博弈也是如此,在婚姻初期谁做家务做得多,那就意味着可能这一辈子他/她都会做更多的家务,这也是一个聚点。

本文发布于:2024-09-20 16:51:32,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/628494.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:博弈   策略   得到   上司   结果   组织   下属   妻子
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议