<<博弈论>>归纳1

博弈论:互动的决策论

博弈的目的:利益最大化

博弈的4个要素:

1.2个以上的参与者

2.博弈要有各方争夺的资源

3.参与者有自己能够选择的策略

4.参与者拥有一定的信息

常用分析工具:收益矩阵

所有博弈者的策略都有相互依存的关系,每个博弈者所得结果的好坏不仅取决于自身的策略选择,同时取决于其他参加者的策略选择。

纳什均衡:参与人的这样一种策略组合，在该策略组合上，任何参与人单独改变策略都不会得到好处。换句话说，如果在一个策略组合上，当所有其他人都不改变策略时，没有人会改变自己的策略，则该策略组合就是一个纳什均衡。

占优策略:是指不论对方采取什么策略，我采取的这个策略总比采取其他任何策略都好的策略

博弈论的局限性

博弈论假设人是理性的,而现实中人在做决策时往往是没有理性的。而且人的时间和精力是有限的,人不可能搜集到所需要的全部信息。

例子1:

伍子胥逃亡,被守卫抓住,伍子胥威胁说:"你知道楚王为什么抓我吗,因为楚王知道我有一颗宝珠,楚王一心想要,可是我的宝珠已经丢失了,楚王不相信,于是我只好逃跑了,现在你抓住了我,那么我将在楚王面前说是你夺去了宝珠并吞到了肚子里,楚王为了得到宝珠一定会先杀了你"守卫信以为真,将伍子胥放了。

收益矩阵

伍子胥的威胁行动,使原本的同时出招的博弈变成了相继出招的博弈,而且伍子胥先行,伍子胥利用信息不对称,将守卫拉入了一种类似囚徒困境的局面。

启示:处于劣势时,创造一种困境,使对方陷入与你一样5无法全身而退的困境,此时他也只能被迫进行理性的决策,与你合作。通过设计改变博弈参与者的格局,很可能改变博弈者原先的决策,最常用的一种方式是有意制造信息不对称

单次博弈与重复博弈

对未来的预期影响着我们的行为,单次博弈意味着高度背叛的可能性,而重复博弈中,有无数次的机会对背叛行为作出惩罚。那么将单次博弈转化为重复多次博弈可以有效提高合作的可能性

带剑的契约才有效

有效的契约包含2个要素

1.惩罚机制

2.重复博弈,如果囚徒困境是一次性博弈,那么签订协议是毫无意义的

有限次博弈与无限次博弈

有限次博弈临近博弈的终点时,采取不合作策略的可能性增大。

破解这种困局的办法就是,千万不能让任何确定无疑的最后一轮博弈出现在视野范围之内。

例子2:

一名科学家举行了一场计算机模拟竞赛,来模拟囚徒困境,共有63个程序参加了模拟赛,最后胜出的程序执行的策略是"一报还一报"策略。也就是第一步合作,此后每一步都重复对方上一步的行动:合作或者背叛。如此简单的程序之所以获胜是因为它奉行了以其人之道还治其人之身的原则,并且用如下特征鼓励其他程序的长期合作。

善良,可激怒,宽容,简单,不嫉妒别人的成功

善良:第一步总是向对方表达善意,坚持永不首先背叛对方,开始时总是选择合作

可激怒:指对方背叛时能够识别并采取背叛行动进行报复

宽容:不会因别人的一次背叛就没完没了的报复

简单:指它的逻辑清晰,能够让别人在较短的时间内识别出来

不妒忌:指它不耍小聪明,不占对方便宜,不在任何双边关系中争强好胜

爱克斯罗德通过进一步研究,发现合作的必要条件是

1.重复博弈

2.对对方的行为回报,合作或者背叛

那么如何提高合作性呢?

1.建立持久的关系

2.增强识别对方行动的能力,如果不清楚对方是合作还是背叛,就没办法回报对方了

3.维持声誉,说报复就一定要做到,对方才知道你是不好欺负的

4.能够分步完成的对局不要一次完成,以维持长久关系。比如贸易,谈判都要分步进行

5.不要嫉妒别人的成功