博弈论(2)—纳什均衡

小知识，大挑战！本文正在参与“程序员必备小知识”创作活动。

纳什均衡

是在 1994 年诺贝尔经济学奖获奖者约翰纳什的名字命名今天，纳什均衡被广泛应用于各个领域的研究，尤其在经济科学领域，纳什均衡对经济学科有非常重要的影响。

那么什么是纳什均衡

博弈论研究的是理性行为，也就是每个局中人都会根据对手的策略选择自己最有利的策略，即最优反应。

数据结构—树、二叉树简介介绍什么是树以及树基本术语，介绍什么是二叉树，以及二叉树分类、特性。

		A	A
	坦白	抗拒
B	坦白	3,3	0,5
B	抗拒	5,0	1,1

多么经典的博弈论问题，囚徒困境，A 和 B 两个囚徒，每一个单元格为一个局势，A 和 B 给出自己策略，单元给为 A 和 B 在给出各自策略的效用函数。每个组合效用函数值组合第一个值为 A 的效用函数值，二个为 B 的效用函数值。如果 A 选择坦白，那么 B 囚徒坦白 3 抗拒将被判 5 年，因为 3 年少于 5 年，所以 B 会选择坦白，那么当 A 选择抗拒情况，B 选择坦白为释放，抗拒为 1 年，所以 B 还会选择坦白。

对于 A 同理也是无论 B 选择哪一个都会选择坦白。对博弈中的参与人 A、B 两个人来说，不管对方选择什么策略，坦白策略都是他们各自占优策略。抗拒策略称为劣策略。

占优策略

一般来说，在一个二人博弈中，考察一个局中人 A 策略集中的任意两个策略 A1、A2，如果不论对方采取何种策略，局中人 A 的策略 A1 的收益总是严格大于策略 A2 的收益，我们就称策略 A2被策略 A1 严格占优，或者策略 A1 为严格占优策略，称策略 A2 为严格劣策略。

如果不论对方采取何种策略，局中人 A 的策略 A1 的收益总是严格大于等于策略 A2 的收益，我们就称策略 A2被策略 A1 占优策略，或者策略 A1 为占优策略，称策略 A2 为劣策略。

占优策略均衡

在经济学中，稳定且可测的互动行为模式。当一个博弈中每一个参与者都选择了各自的占优策略时，相应的博弈结果就是占优策略均衡。

占优策略均衡

纳什均衡

由所有参与人的最优策略组成的策略组合。此策略组合也被称为纳什均衡点。

在纳什均衡中，每一个理性的参与都不会有单独改变策略的动机，因为局中的每一个博弈者都不可能因为单方面改变自己的策略而增加获益。

个体理性并不意味着是最佳的结果，这一点从囚徒困境就可以看出，他们都选择坦白，而不如都选择抗拒各自都收到更大利益。

合作均衡

各方协调行动，以求共同的支付最优化的策略而达到的结果。一般来说，如果博弈的参与者都能够履行协商后的策略，则他们选择的策略就构成了合作均衡。