纯策略纳什均衡和混合策略纳什均衡

越明年
策略纳什均衡和混合策略纳什均衡丁度.巴拉斯
简单来说,纯策略纳什均衡指的是,参与选择的策略是确定的。比如,在性别之战中,我们通过每个参与人的最优反应确定了该博弈的两种纯策略,即(拳击,拳击)和(芭蕾,芭蕾)。
在纯策略纳什均衡的情况下,我们只能知道具体的纳什均衡下每个参与人的收益,并无法求得参与人进行该博弈的整个的期望收益。(暂且称为期望收益吧),因为在参与人做选择时,并不知道对方会做出什么样的选择。
假设我们自己为参与人1,我们就会开始想,现在我也不知道对方(参与人2)会做什么样的选择,我先假设他选择芭蕾的概率为p吧,那么他选择拳击的概率就是1-p,那么这个时候,我们自己在两种策略下的收益为,我们就会选择芭蕾,如果我们就会选择拳击。我们可以画出参与人1的最优反应曲线E1是双方都百分百选择拳击,E2是双方都百分百选择芭蕾,也就是我们之前求出的纯策略纳什均衡,而E3就是我们要算的混合策略纳什均衡。
溶菌酶灰尘的作用在该点U1=4/3由于博弈是对称的,U2=4/3由于参与人1在(拳击,拳击)时的收益1比选择
(芭蕾,芭蕾)时的E3的收益4/3低,所以参与人1是肯定不会百分百选择E1作为均衡点的,同理,参与人2也不会百分百选择E2作为均衡点。既然参与人都可以自主选择自己的概率,那么只有在混合策略纳什均衡点E3这一个均衡。即参与人1分别以2/3和1/3的概率选择芭蕾和拳击,参与人2以1/3和2/3的概率选择芭蕾和拳击。
所以在这个博弈里,只有一个混合策略纳什均衡,也就是E3点所代表的均衡。只要偏离这个点的概率,那么博弈的结果就会变为E1或者E2,这时总会有一个参与人不愿选择这样的结果,博弈无法达到均衡。所以最终寻这个严格混合策略纳什均衡点的过程可以陈述为,给定其他参与人的混合策略,目标参与人在可行行动中的任意随机选择都是无差异的。
霍尔电流即令2p=1-p,q=2(1-q),这就是寻混合策略纳什均衡的解题方式。也可以通过同时假设两个参与人的概率,写出每个参与人在假设概率下的效用,通过让双方同时效用最大化求解。但直接使用上面说的结论会比较简单。锰结核
最后总结一下,在纯策略纳什均衡时,有两个纳什均衡,但博弈会达到哪个结果并不确定,而参与人总归是要选择一个策略的,在选择策略时,自己选择策略的概率是可以由自
己确定的,所以我们有了混合策略纳什均衡。会有一定的预测作用,因为如果性别之战是一个长期重复的博弈,你的之前的选择总会观测到,最终对方也会根据你的习惯选择自己的策略,比如经常比赛的足球队就可以观测到对方球队的数据,并因此做出自己的最优选择,为了使自己的收益最大化,我们必须选择一个概率,让对方随机选择策略。虽然并不知道题主的硬币正反是一个什么样的问题,但混合策略纳什均衡的原理是一样的。

本文发布于:2024-09-20 21:35:45,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/550708.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:选择   参与   策略   概率
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议