《博弈论基础》阅读笔记(一)

博弈的分根据不同的基准也有不同的分

一般认为博弈主要可以分合作博弈非合作博弈。合作博弈和非合作博弈的区在于相互生作用的当事人之有没有一个具有束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

从行时间序列性,博弈论进一步分为博弈动态博弈:静博弈是指在博弈中,参与人同时选择非同时选择但后行者并不知道先行者采取了什么具体行动态博弈是指在博弈中,参与人的行有先后序,且后行者能够观察到先行者所选择的行。通俗的理解:"囚徒困境"就是同决策的,属于静博弈;而棋牌等决策或行有先后次序的,属于动态博弈

按照参与人其他参与人的了解程度分完全信息博弈不完全信息博弈。完全博弈是指在博弈程中,每一位参与人其他参与人的特征、策略空收益函数有准确的信息。不完全信息博弈是指如果参与人其他参与人的特征、策略空及收益函数信息了解的不准确、或者不是所有参与人的特征、策略空及收益函数都有准确的信息,在种情况下行的博弈就是不完全信息博弈。

经济学家们所谈的博弈论一般是指非合作博弈,由于合作博弈非合作博弈,在理上的成熟度远远不如非合作博弈。非合作博弈又分完全信息静博弈完全信息动态博弈不完全信息静博弈不完全信息动态博弈。与上述四种博弈相对应的均衡概念纳什均衡(Nash equilibrium),子博弈精炼纳什均衡subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),炼贝叶斯均衡(perfect Bayesian equilibrium)

博弈论还有很多分,比如:以博弈行的次数或者持续长短可以分有限博弈和无限博弈;以表形式也可以分一般型(略型)或者展开型;以博弈的逻辑不同又可以分为传统博弈和演化博弈。

 

一、完全信息静态博弈

1、求解纳什均衡的方法:(1)重复剔除严格劣战略;(2)定义法(满足纳什均衡定义);(3)划线法;(4)双方最优反应函数交点

2、纳什均衡的不唯一性、纳什均衡的存在性定理

3、混合战略纳什均衡,纯战略是混合战略的一种情况。

4、纳什定理:在n个参与者的标准式博弈G={S1,S2,….,Sn;u1,u2,…un}中,如果n是有限,且对每个i,Si是有限的,则博弈存在至少一个纳什均衡,均衡可能包含混合战略。(混合战略纳什均衡总是存在的)

 

二、完全信息动态博弈

1、完全且完美的信息博弈;完全但不完美信息博弈:在博弈的某些阶段,要选择行动的参与人并不知道在这一步之前进行的整个过程。

2、1)子博弈(subgame):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,前面整个博弈的进行过程在所有参与者中都是共同知识,能够自成一个博弈的原博弈的一部分。即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。

2)子博弈精炼解。针对纳什均衡的多重性,子博弈精炼剔除了基于不可置信的威胁或承诺之上的纳什均衡。

3)子博弈精炼纳什均衡:扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。或者说:如果动态博弈的一个策略组合不仅在均衡路径上是纳什均衡,而且在非均衡路径上也是纳什均衡,就是该动态博弈的一个子博弈精炼纳什均衡。

3、完全且完美信息动态博弈的特点:1)行动是顺序发生的;2)下一步行动选择之前,所有以前的行动都可以被观察到;3)每一可能的行动组合下参与者的收益都是共同知识。

4、逆向归纳解不含有不可置信的威胁,在有限博弈中用逆向归纳法求出的逆向归纳解,必为子博弈精炼解;博弈的扩展式表述:博弈树。

5、多个博弈阶段的标准式表示。完全非完美信息两阶段博弈(及其变种):

1)参与者1和2同时从各自的可行集A1和A2中选择行动a1和a2;

2)参与者3和4观察到第一阶段的结果(a1,a2),然后同时从各自的可行集A3和A4中选择行动a3和a4;

3)收益为ui(a1,a2,a3,a4),i=1,2,3,4。

6、重复博弈定义及定理:令G={A1,…,An;u1,…,un}表示一个完全信息博弈,其中参与者1到n同时从各自的行动空间A1到An中分别选择行动a1到an得到的收益分别为u1(a1,…,an),…,un(a1,…,an),称博弈G为重复博弈中的阶段博弈。

定义:对给定的博弈阶段G,令G(T)表示G重复进行T次的有限重复博弈,并在下一次博弈开始前,所有以前博弈的进行都可被观测到。G(T)的收益为T次阶段博弈收益的简单相加

定理:如果阶段博弈G有唯一的纳什均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解:即G的纳什均衡结果在每一阶段重复进行。(该结论对于阶段博弈G为完全信息动态博弈或两阶段囚徒博弈时同样成立)

7、在有限重复博弈中,如果阶段博弈G有多个纳什均衡,重复博弈G(T)就可能会存在子博弈精炼解,其中对任意t<T,阶段t的结果都不是G的纳什均衡;在无限重复博弈中一个更强的结论成立:即使阶段博弈有唯一的纳什均衡,无限重复博弈中也可以存在子博弈精炼解,其中没有一个阶段的结果是G的纳什均衡。

8、无限重复博弈:给定一个阶段博弈G,令G(∞,∂)表示相应的无限重复博弈,其中G将无限次地重复进行,且参与者的贴现因子都为∂。对每一个t,之前t-1次阶段博弈的结果在t阶段开始进行前都可被观测到,每个参与者在G(∞,∂)中的收益都是该参与者在无限次的阶段博弈中所得收益的现值。

9、在有限重复博弈G(T)或无限重复博弈G(∞,∂)中,博弈到阶段t的进行过程(history of play through state t)指各方参与者从阶段1到阶段t所有行动的记录。

10、在有限重复博弈G(T)或无限重复博弈G(∞,∂)中,参与者的一个战略特指在每一阶段,针对其前面阶段所有可能的进行过程,参与者将会选择的行动

11、在有限重复博弈G(T)中,由第t+1阶段开始的一个子博弈为G进行了T-t次后的重复博弈,可表示为G(T-t)。在无限重复博弈G(∞,∂)中,由第t+1阶段开始的每个子博弈都等同于初始博弈G(∞,∂)。和在有限情况下相似,博弈G(∞,∂)到t阶段为止有多少不同的可能进行过程,就有多少从t+1阶段开始的子博弈。

12、弗里德曼定理:令G为一个有限的完全信息静态博弈,令(e1,…,en)表示G的一个纳什均衡下的收益,且(x1,…,xn)表示G的其他任何可行收益。如果对每一个参与者i有xi>ei,且如果贴现因子足够接近于1,则无限重复博弈G(∞,∂)存在一个子博弈精炼纳什均衡,其平均收益可到达(x1,…,xn)。

13、完全非完美信息动态博弈。

14、定义:一个博弈的拓展式表述包括:(1)博弈中的参与人;(2a)每一参与者在何时行动;(2b)每次轮到某一参与者行动时,可供他选择的行动;(2c)每次轮到某一参与者行动时,他所了解的信息;(3)参与者可能选择的每一行动组合相对应的各个参与者的收益。

15、用博弈的标准式表示动态博弈;用博弈的拓展式表示静态博弈。定义:参与者的一个信息集(information set)指满足以下条件的决策节(decision node)的集合:

1)在此信息集中的每一个节都轮到该参与者行动,且

2)当博弈的进行达到信息集中的一个结,应该行动的参与者并不知道达到了(或没有达到)信息集中的哪一个节。

16、对完美信息的一个等价的定义是每一个信息集都是单节的;相反,非完美信息则意味至少存在一个非单节的信息集。

17、拓展式博弈中的子博弈定义

1)始于单节信息集的决策节n。(但不包括博弈的第一个决策节)

2)包含博弈树中n之下所有的决策节和终点节。

3)没有对任何信息集形成分割。即如果博弈树中n之下有一个决策节n’,则和n’处于同一信息集的其他决策节也必须在n之下,从而也必须包含于子博弈中。

18、任何有限的完全信息动态博弈(即任何参与者有限、每一参与者的可行战略集有限的博弈)都存在子博弈精炼纳什均衡,也许包含混合战略。

19、“均衡”与“解”的区别:一个均衡是战略的集合(战略又是关于行动的完全的计划),而一个解则只对期望将要发生的特定情况给出相应的行动及结果,而不是针对所有可能发生的情况。在一个定义的完全且完美信息两阶段博弈中,逆向归纳解为(a1*,R2(a1*)),而子博弈精炼纳什均衡为(a1*,R2(a1)),其中R2(a1*)只是一个行动,具体来说是对a1*的最优反应,而R2(a1)是一个最优反应函数,它是一个战略。

发布了25 篇原创文章 · 获赞 11 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/pgs1004151212/article/details/88551396