## 博弈论笔记

博弈论笔记

西方伦理学把人类的道德准则分为四金律、银律、铜律和铁律。
金律(Golden Rule),可以称为“作为者”的行为准则,其内容是:“你要别人怎样对待你,你就怎样对待别人。”也就是孔子所说的“己欲立而立人,己欲达而达 人”。 银律(Silver Rule),可以称为“退让者”的行为准则,也就是孔子所说的“己所不欲,勿施于人”。 铜律(Bronze Rule),可以称为“报复者”的行为准则,其内容是:“别人怎样对待你,你就怎样对待别人。” 铁律(Iron Rule),可以称为“进攻者”的行为准则,其内容是:“在别人进攻你之前,首先进攻别人。”
第5章 一报还一报 出来混迟早要还的
但是,在并不完美的现实世界,一报还一报,并不是最适合的策略,因为现实世界存在误差,而这个时候,一报还一报,会导致更大的伤害。为了改变,所以有了再一再二不再三这句话。适当的宽容,带来的是更大的信任,更大的利益,但是过度的信任,只是一个傻子。

  1. 公共资源,往往是最快损坏的,因为是不需要珍惜的。
    2.博弈论里面有一句话一加一未必等于二,其实很简单的道理,每一步都是比上一步操作更优,但是并不一定会接近最初的目标,更大的可能偏离目标。
    类似于贪心算法,过桥问题
    问题如下:
      在漆黑的夜里,甲乙丙丁共四位旅行者来到了一座狭窄而且没有护栏的桥边。如果不借助手电筒的话,大家是无论如何也不敢过桥的。不幸的是,四个人一共只带了一只手电筒,而桥窄得只够让两个人同时过。如果各自单独过桥的话,四人所需要的时间分别是1、2、5、8分钟;而如果两人同时过桥,所需要的时间就是走得比较慢的那个人单独行动时所需的时间。问题:如何设计一个方案,让这四人尽快过桥。

答案如下
  两人过桥后,需要把手电筒送回,最容易想到的是让最快的人担任来回送电筒。因此,第一种办法:先让甲乙过去(2分钟),甲回来(1分钟),甲丙过去(5分钟),甲回来(1分钟),甲丁再过去(8分钟),总共需要17分钟就可以让四个人都过去。

而正确答案是第二种办法:先让甲乙过去(2分钟),甲回来(1分钟),丙丁过去(8分钟),乙回来(2分钟),甲乙再过去(2分钟),总共需要15分钟就可以让四个人都过去。这种方法的关键点,让两个最慢的人同时过桥

大学者钱钟书说过这样一句意味深长的话:要想把哪个东西搞坏,不要骂它、不要臭它,而是让它无限制地繁殖泛滥,结果它自然就名声扫地了。
3.在程序员的数学——概率统计中,假如在一个游戏节目里,主持人指出标有1、2、3的三扇门给你,而且明确告诉你,其中两扇门背后是山羊,另一扇门后有名牌轿车。你要从三扇门里选择一扇,并可以获得所选门后的奖。既然是三选一,很清楚 ,选中汽车的机会就是1/3。 在没有任何信息帮助的情况下,你选了一扇(比如1号门)。但主持人并没有立刻打开1号门,而是打开了3号门,门后出现的是一只羊。这时,主持人问你是否要改变主意选2号门。 现在你就面临一个策略问题了:改还是不改?而,这时候应该理所当然的更改,因为就算1号门有车子,也只是二分之一的概率,改变并不会失去什么,按照普通人的思维来说。但是,按理说,主持人并不会打开有车子的在这种可能性下,如果车子在1号门后面,他就可以随便开2号门或3号门。如果车子没有在1号门后面,那么他所开的一定是没有车子的那扇门,开3号门相当于告诉你车子在2号门的后面,因此2号门就有2/3的机会。在这种情况下,那你就应该赶快换。虽然换选未必保证你一定会获胜,但还是使获胜机会加倍了。
推理由因到果是很脆弱的,因为其中的可能由性太多,每一个可能性都会导致失败,不如试试倒推法。
但是倒推法也有本身的缺陷,比如最著名的蜈蚣博弈,就是倒推法的实例。
以下内容来自百度百科
“蜈蚣博弈”是指这样一个博弈:两个博弈方A、B轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。他们的博弈展开式如下:
A —— B —— A ——…… A —— B —— A —— B —— (10,10)
| * * * * | * * * | * * * * * * | * * * *| * * * * | * * * |
(1,1) * (0,3) * (2,2) * * * (8,8) * (7,10) * (9,9) * (8,11)
在图中,博弈从左到右进行,横向连杆代表合作策略,向下的连杆代表不合作策略。每个人下面对应的括号代表相应的人采取不合作策略,博弈结束后,各自的收益,括号内左边的数字代表A的收益,右边代表B的收益。如果一开始A就选择了不合作,则两人各得1的收益,而A如果选择合作,则轮到B选择,B如果选择不合作,则A收益为0,B的收益为3,如果B选择合作,则博弈继续进行下去。
可以看到每次合作后总收益在不断增加,合作每继续一次总收益增加1,如第一个括号中总收益为1+1=2,第二个括号为0+3=3,第二个括号则为2+2=4。这样一直下去,直到最后两人都得到10的收益,总体效益最大。遗憾的是这个圆满结局很难达到!
大家注意,在上图中最后一步由B选择时,B选择合作的收益为10,选择不合作的收益为11。根据理性人假设,B将选择不合作,而这时A的收益仅为8。A考虑到B在最后一步将选择不合作,因此他在前一步将选择不合作,因为这样他的收益为9,比8高。B也考虑到了这一点,所以他也要抢先A一步采取不合作策略……如此推论下去,最后的结论是:在第一步A将选择不合作,此时各自的收益为1!这个结论是令人悲伤的。
不难看出,在该博弈的推理过程中,运用的是逆推法。从逻辑推理来看,逆推法是严密的,但结论是不合理的。因为一开始就停止的策略A、B均只能获取1,而采取合作性策略有可能均获取10,当然A一开始采取合作性策略有可能获得0,但1或者0与10相比实在是很小。直觉告诉我们采取“合作”策略是好的。而从逻辑的角度看,A一开始应选择“不合作”的策略。人们在博弈中的真实行动“偏离”了运用逆推法关于博弈的理论预测,造成二者间的矛盾和不一致,这就是蜈蚣博弈的悖论。

发布了19 篇原创文章 · 获赞 9 · 访问量 882

猜你喜欢

转载自blog.csdn.net/qq_43761222/article/details/103556781