经典博弈案例 "囚徒困境” 分析

博弈论又称对策论，是研究两人或多人之间竞争合作关系的一门科学。目前被大众熟知的例子有:田忌赛马等等。

而所谓的"囚徒困境"也是这样的一个经典例子，大意是这样的:

两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。警察告诉每个人:如果两人都抵赖，各判刑一年;如果两人都坦白，各判八年;如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。于是，每个囚徒都面临两种选择:坦白或抵赖。

在这种情景下，两个囚犯都可以做出自己的选择:供出他的同伴，即与警察合作，从而背叛他的同伙；或者保持沉默，也就是与他的同伙合作，而不是与警察合作。(用双变量矩阵来描述更易于理解）

如果两人都抵赖，各判一年，显然这个结果更好一些。囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益(无罪开释)，但在对方的表现不明的情况下，因为出卖同伙可为自己带来利益(缩短刑期)，也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。

如同博弈论的其他例证，囚徒困境假定每个参与者(即"囚徒")都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益，这也就是经典经济学中的"理性人假设"。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为"严格劣势"，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁，并不知道对方选择;而即使他们能交谈，还是未必能够相信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。现设想困境中两名理性囚徒会如何作出选择:

若对方沉默时，背叛会让我获释，所以会选择背叛。

若对方背叛、指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。

二人面对的情况一样，所以二人的理性思考都会得出相同的结论--选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。

这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑1年，总体利益更高，结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设，二人均为理性客观的个人，并且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中，帕累托最优和纳什均衡是相冲突的。而且纳什均衡是较常发生的。

扫描二维码关注公众号，回复： 4425395 查看本文章

经典博弈案例 "囚徒困境” 分析

猜你喜欢