矩阵博弈模型 控制论

矩阵博弈模型 控制论第二代测序
博弈论解决的是多个决策者即博弈参与者(某些情况下称为代理人)之间的策略交互。由一个目标函数刻画每个参与者在多个可能的博弈结果之间的排序偏好,她要么试图最大化目标函数(在此情况下,目标函数是效用函数或效益函数),要么最小化目标函数(在这种情况下,我们称目标函数为成本函数或损失函数)。
对非平凡博弈来说,参与者的目标函数取决于至少一位其他参与者的选择(行为或决策变量),并且通常是所有参与者的选择,因此参与者不能简单地独立于其他人的选择而优化自己的目标函数。
因此,这使参与者的行动之间产生了耦合,并导致即便在非合作环境下,参与者在决策过程中也绑定在一起。
如果参与者能达成合作协议,形成集体性的、完全可信的行动或决策选择,让所有参与者都能尽可能地受益,那么我们将处于合作博弈论的领域。
如果参与者之间不允许合作,那么我们就处于非合作博弈论的领域。博弈论,作为一种系统
2016年5月11日性的方法,首先必须引入一个令人满意的解概念。
首要地,解应具有这样的特征:所有参与者都不能通过单边行动来提高收益,这就是所谓的非合作均衡或以约翰•纳什的名字命名的纳什均衡。
60多年前,约翰·纳什引入了它,并且证明它存在于有限博弈(即每个参与者只有有限数量的替代方案的博弈)和混合策略中。对任意一个参与者,如果其他参与者按照纳什均衡采取行动,这个参与者将无法通过偏离纳什均衡来提高自己的收益。开同>目击证人
请注意,我们不允许两个或两个以上的参与者从解点集体行动,因为这样的集体行动需要合作,这是不允许在非合作博弈中发生的。
另一个非合作均衡解的概念是斯塔克尔伯格均衡(Stackelbergequilibrium),它实际上先于纳什均衡提出。
其中,参与者的决策之间有一个层次,一些参与者被指定为领导者,有能力首先宣布他们的策略(并承诺执行他们);其余的参与者被指定为跟随者,根据领导者的策略决定他们的策略(追随者之间也存在相互博弈)。包装与食品机械
然而,在宣布策略之前,领导者会预测追随者的反应,并以一种对自己最有利的方式决定其行动(就其目标函数而言)。

本文发布于:2024-09-22 17:21:48,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/161247.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:参与者   函数   合作   博弈   目标   策略
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议