博弈论三大经典案例

1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：

渡边淳一警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：

∙若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

∙若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。

∙若二人都互相检举（互相“背叛”），则二人同样判监2年。

用表格概述如下：

通化师范学院学报

	甲沉默（合作）	甲认罪（背叛）
赵薇天使旅行箱乙沉默（合作）	尿苷二人同服刑半年	甲即时获释；乙服刑10年
乙认罪（背叛）	甲服刑10年；乙即时获释	二人同服刑2年

如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：

∙若对方沉默、背叛会让我获释，所以会选择背叛。

∙若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。

这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。

由囚徒困境可以写出类似的员工困境：

一名经理，数名员工; 前提，经理比较苛刻;

如果所有员工都听从经理吩咐，则奖金等待遇一样，不过所有人都超负荷工作

如果某人不听从吩咐，其他人听从吩咐，则此人下岗。其他人继续工作

如果所有人都不听从经理吩咐，则经理下岗

但是，由于员工之间信息是不透明的，而且，都担心别人听话自己不听话而下岗，所以，大家只能继续繁重的工作.

囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。

在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡滚雪球抽样趋向于帕累托最优。

智猪博弈理论

在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。

实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本，以下纯收益计算相同)，而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动；在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。

在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择。这时候有所不为才能有所为！

高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。

斗鸡博弈

斗鸡博弈(Chicken Game)其实是一种误译。Chicken在美国口语中是“懦夫”之意，Chicken Game本应译成懦夫博弈。不过这个错误并不算太严重，非要把chicken game叫作斗鸡博弈，也不是不可以。

试想有两人狭路相逢，每人有两个行动选择：一是退下来，一是进攻。如果一方退下来，而对方没有退下来，对方获得胜利，这人就很丢面子；如果对方也退下来，双方则打个平手；如果自己没退下来，而对方退下来，自己则胜利，对方则失败；如果两人都前进，那么则两败俱伤。因此，对每个人来说，最好的结果是，对方退下来，而自己不退。赢利矩阵(payoff matrix)如下：

甲/乙前进后退

前进 (-2，-2) (1，-1)

后退 (-1，1) (-1，-1)

上表中的数字的意思是：两者如果均选择“前进”，结果是两败俱伤，两者均获得-2的支付；如果一方“前进”，另外一方“后退”，前进者获得1的支付，赢得了面子，而后退者获得-

1的支付，输掉了面子，但没有两者均“前进”受到的损失大；两者均“后退”，两者均输掉了面子，获得-1的支付。当然表中的数字只是相对的值。

这个博弈有两个纯策略纳什均衡：一方前进，另一方后退；或一方后退，另一方前进。但关键是谁进谁退？当然，该博弈也存在一个混合策略均衡，即大家随机的选择前进或后退。不过相对而言，我们更关注于纯策略均衡。一博弈，如果有惟一的纳什均衡点，那么这个博弈是可预测的，即这个纳什均衡点就是事先知道的惟一的博弈结果。但是如果一博弈有多个纳什均衡，则要预测结果就必须附加另外的有关博弈的细节信息。比如，这里谁进谁退，可能就需要附加额外的细节信息才能做出判断。

本文发布于:2024-09-20 17:48:46，感谢您对本站的认可！

本文链接：https://www.17tex.com/xueshu/600717.html

上一篇：博弈论三种均衡的异同

下一篇：博弈论教程答案

标签：选择博弈囚徒对方困境背叛结果

留言与评论（共有 0 条评论）