博弈论基础

基本概念

完全信息：完全信息是指所有参与者完全了解自己以及参与者的策略空间（也即可行策略），完全了解各参与者选择的策略组合产生的效用（也即支付函数）。不完全信息是指双方可以获取的信息具有不对称性，一方知道对手的策略空空间以及对应效用，但是对手不知晓自己的策略空间以及对应效用。

完美信息：参与者对于之前双方每一步博弈的过程完全了解，比如下围棋，下棋者知道双方之前每一步落子的位置，这就是一个完美信息博弈。不完美信息是指双方可以获取的信息具有不对称性，一方知道对手之前所有的历史策略，但是对手不知道自己的历史策略。

静态：博弈中各参与者同时选择各自的策略，这里说“同时”有两个含义：一种含义是指不同参与者在同一时间一起行动；另一种含义是不同参与者行动虽然有先后，但是后行动者不知道先行动者具体采取了什么行动。本质上静态博弈是指博弈双方不知道对方采取了什么行动。一个典型例子就是“囚徒困境”，这是一个完全信息的静态博弈，囚徒知道双方的策略空间以及后果，但是不清楚对方具体选择了哪种策略。

动态：不同参与者行动有先后顺序，并且后行动者能够观察到先行动者所选择的行动。

常见博弈类型

演化博弈：演化博弈假定参与者是在具有有限理性(Bounded Rationality) 的基础上，分析参与者进行的策略选择，得到的是有限理性下的博弈均衡。这里的有限理性代表了参与者具有一定的统计分析能力和对不同策略下得到收益的事后判断能力，但缺乏事前的预测和判断能力。正因为存在有限理性，参与者在演化博弈中不断学习、不断的试错找到最优的策略。这意味着演化博弈中的均衡不是一次选择的结果，而是需要动态地调整和适应才能达到，并且即使达到了均衡，在环境改变的前提下，可能会出现偏离现象。一个种群具有演化稳定策略就意味着该种群具有很大的稳定性，它将能抑制任何变异对种群的干扰。

演化稳定策略具有以下重要性质：

演化稳定策略是一种对称的、完美的均衡。
演化稳定策略代表了静态概念,在多种情况下可以直接从博弈模型的支付矩阵中得到演化稳定策略
纳什均衡不一定是演化稳定策略,只有达到严格纳什均衡才一定是演化稳定策略;反过来,演化稳定策略肯定是纳什均衡,其实质是纳什均衡的精炼。
若一个对称的策略组合是纳什均衡,那么它是演化稳定策略

复制动态模型是目前描述个体行为机制的一种典型的动力学模型，这是一种确定性和非线性模型，

微分博弈：使用微分博弈可以描述动态博弈系统的演化过程。类似于最优控制，微分博弈考虑考虑的是博弈双方多个最优控制过程。由于在连续时间上描述参与者之间的最优策略相互关系比较困难，因此需要作一些条件限制，在微分博弈里一般是对策略空间作出限制。这些限制当中比较严格的限制为“开环” (Open-loop) 控制策略，该类型的控制策略要求参与者在博弈过程中得不到新的消息，所以只能构造出一个随时间而变化的控制函数作为自己的控制策略，而不能根据参与者双方的实际博弈进程的情况来动态调整自己的控制策略。比“开环”控制策略限制要弱一些的是“闭环” (Closed-loop) 控制策略，该策略使参与者可以得到反馈信息，从而动态实时地更改各自的控制策略。微分博弈的均衡解主要有 开环纳什均衡 、闭环纳什均衡 和 反馈纳什均衡。

随机博弈：随机博弈过程的状态转移过程是Markov过程，它是一类具有状态转移概率的动态博弈，它由一系列阶段组成。随机博弈按照概率的分布和参与者的动作策略随机转移到下一个“阶段博弈”。对于有限阶段和有限状态的随机博弈都存在纳什均衡解，零和随机博弈一定存在纳什均衡解。

参考文献

[1] 沈士根, 刘建华, 曹奇英. 博弈论与无线传感器网络安全[M]. 清华大学出版社, 2016.
[2] 范如国. 博弈论Game theory[M]. 武汉大学出版社, 2011.

基本概念

常见博弈类型

参考文献

猜你喜欢