【博弈论笔记】第六章不完全信息静态表示

文章目录

第六章不完全信息静态表示

此部分博弈论笔记参考自经济博弈论（第四版）/谢识予和老师的PPT，是在平时学习中以及期末备考中整理的，主要注重对本章节知识点的梳理以及重点知识的理解，细节和逻辑部分还不是很完善，可能不太适合初学者阅读（看书应该会理解的更明白O(∩_∩)O哈哈~）。现更新到博客上供大家浏览，希望能够帮助到正在学习博弈论的大家。

第六章不完全信息静态表示

6.1 不完全信息静态博弈和贝叶斯纳什均衡

在一个静态博弈中，至少有一个博弈方不完全清楚其他某些博弈方的策略或得益等信息，但知道其策略或得益等信息空间的概率分布，这种博弈叫不完全信息静态博弈，也叫贝叶斯博弈。

6.1.1 不完全信息静态博弈的例子

暗标拍卖

暗标拍卖通常有这样几个基本特征:(1)密封递交标书; (2)统一时间公证开标; (3) 标价最高者以所报标价中标。
- 由于博弈方的标书密封递交和同时开标, 各博弈方在选择策略之前都无法知道其他博弈方策略, 而且是一次性选择, 因此这是静态博弈问题。
- 各博弈方无法知道确知其他博弈方拍得标的物的得益，最多能根据一般情况或以往经验作大致判断。这意味着, 暗标拍卖博弈是不完全信息博恋, 且是不完全信息静态博弈。
古诺模型
- 假设：两寡头同时作产量决策, 市场需求为 $P(Q)=a-Q, Q=q_1+q_2$ 为市场总产量, $q_1 、 q_2$ 分别是两个厂商产量。厂商 1 成本函数 $C_1=C_1\left(q_1\right)=c_1 q_1$ , 即无固定成本, 边际成本为 $c_1$ , 这是两个厂商都知道的。厂商 2 的成本有两种可能情况, 一种 $C_2=C_2\left(q_2\right)=c_H q_2$ , 另一种 $C_2=C_2\left(q_2\right)=c_L q_2$ , 而 $c_H>c_L$ , 究竟是哪种成本厂商 2 自己知道,厂商 1 只知道前一种的概率 $\theta$ , 后一种的概率 $1-\theta$ 。
- 分析：
  - 当高成本, $q_{2}{ }^*\left(c_{H}\right)$ 满足： $\max _{q_2}\left[\left(a-q_1-q_2\right)-c_{\mathrm{H}}\right] q_2$
  - 当低成本, $\mathbf{q}_{\mathbf{2}}{ }^*\left(\mathbf{c}_{\mathbf{L}}\right)$ 满足： $\max_{q_1} \left[\left(a-q_1-q_2\right)-c_L\right] q_2$
  - 厂商一的策略： $\max _{q_1}\left\{\theta\left[a-q_1-q_2^{*}\left(c_H\right)-c_1\right] q_1+(1-\theta)\left[a-q_1-q_2^*({c_L})-c_1\right] q_1\right\}$
- 求解：三个式子各自求极值，然后联立求解，得：
  $\begin{aligned} & q_2^*\left(c_H\right)=\frac{a-2 c_H+c_1}{3}+\frac{1-\theta}{6}\left(c_H-c_L\right) \\ & q_2^*\left(c_L\right)=\frac{a-2 c_L+c_1}{3}-\frac{\theta}{6}\left(c_H-c_L\right) \\ & q_1^*=\frac{a-2 c_1+\theta c_H+(1-\theta) c_L}{3} \end{aligned}$
- 讨论:当 $c_2=c_H$ 时， $q_2^*(c_H)>q_2^*$ ，当 $c_2=c_L$ 时， $q_2^*(c_L)<q_2^*$ .
  
  当厂商2实际高成本时，他本应生产较少，但他考虑到对方不知道自己高成本, 所以对方选择的产量会小于知道自已高成本时的最佳产量, 因此自己可以适当多生产一些。

6.1.2 不完全信息静态博弈的一般表示

在完全信息静态博弈时，我们将其表示为： $G=\left\{S_1, \cdots, S_n ; u_1, \cdots, u_n\right\}$ ,

其中 $S_i$ 是博弈方 $i$ 的策略空间, 即全部可选策略的集合, $u_i$ 是其得益函数 $u_i=u_i\left(s_1, \cdots, s_n\right)$ 。

到了不完全信息静态博弈中，需要表示信息的不完全性，用 $T$ 来表示： $t_i$ 表示博弈方 $i$ 的类型, $T$ ，表示博弈方 $i$ 的类型空间 $t_i \in T_i, u_i\left(a_1, \cdots, a_n, t_i\right)$ 表示博弈方 $i$ 在策略组合 $\left(a_1, \cdots, a_n\right)$ 下的得益。信息不完全可以通过 $t_i$ 的取值只有博弈方 $i$ 知道而其他博弈方不清楚这一情况来反映。

另一个需要添加的是博弈方对不完全信息概率的判断：如果用博弈方 $i$ 在自己类型为 $t_i$ 的前提下, 对其他博弈方类型的所有可能(或类型组合) $=\left(t_1, \cdots\right.$ $\left.t_{i-1}, t_{i+1}, \cdots, t_n\right)$ 的条件概率 $p_i=p_i\left\{t_{-i} \mid t_i\right\}$ , 作为反映不完全信息的概率判断, 则可用 $G=\left\{A_1, \cdots, A_n ; T_1, \cdots, T_n ; p_1, \cdots, p_n ; u_1, \cdots ,u_n\right\}$ 表示不完全信息静态博弈问题。

以不完全信息古诺博弈为例：
$\begin{aligned} & \text { 厂商 } 1 \text { 的行动空间- } A_1=\left\{q_1\right\} \\ & \text { 厂商 } 2 \text { 的行动空间- } A_2=\left\{q_2\right\} \\ & \text { 厂商 } 1 \text { 的类型空间- } T_1=\left\{c_1\right\} \\ & \text { 厂商 } 2 \text { 的类型空间- } T_2=\left\{c_H, c_L\right\} \\ & \text { 厂商 } 1 \text { 的得益- - } u_1=\pi_1\left(q_1, q_2, t_1\right) \\ & \text { 厂商 } 2 \text { 的得益-- } u_2=\pi_2\left(q_1, q_2, t_2\right)\\ & \text { 厂商 } 1 \text { 条件概率- } p_1\{c_H|c_1\}=\theta;p_1\{c_L|c_1\}=1-\theta\\ &\text { 厂商 } 2 \text { 条件概率- } p_2\{c_1|c_H\}=1; p_2\{c_1|c_L\}=1 \end{aligned}$

6.1.3 海萨尼均衡

海萨尼( Harsanyi )1967年提出将“不完全信息静态博弈” 转化为“完全但不完美信息动态博弈”:

第一步：引进虚拟博弈方 “自然”, “自然”进行动态博弈第一阶段的行动选择
- “自然” 为每个博弈方随机选择类型 $t=\left(t_1, \ldots, t_n\right)$ 其中 $t_i \in T_i, i=1, \cdots, n$
第二步：表示不完全信息
- 每个博弈方知道自己的类型，但不知道“自然”为其他博弈方选择的类型，只知道所选类型的概率分布。
第三步：博弈方在动态博弈第二阶段进行原来的静态博弈 $a_1, \ldots, a_n$
第四步：表示得益
- 除 “自然” 博弈方外, 其余博弈方各自得益 $u_i=u_i\left(a_1, \ldots, a_n\right.$ , $\left.t_i\right)$

在作了海萨尼转换之后, 仍然有对 “类型” 的判断问题。但这时对类型的判断形式上变成了对博弈进程,即 “自然”对实际博弈方类型选择的判断, 其概率分布与类型的概率分布相同, 即 “自然”以概率分布 $p_1, \cdots$ , $p_n$ 分别选择 $t_1, \cdots, t_n$ 。

6.1.4 贝叶斯纳什均衡

将纳什均衡推广到不完全信息静态博弈中，基本思想与完全信息静态博弈的纳什均衡是一样的, 各博弈方的策略必须是对其他博弈方策略(或策略组合)的最佳反应。不同的是, 这里的策略比完全信息静态博弈复杂一些,不是简单的行为选择,而是由类型决定行为选择的函数。这种策略有新含义的纳什均衡, 称为 “贝叶斯纳什均衡”。

定义在不完全信息静态博弈 $G=\left\{A_1, \cdots, A_n ; T_1, \cdots, T_n\right.$ ; $\left.p_1, \cdots, p_n ; u_1, \cdots, u_n\right\}$ 中, 如果对任意博弈方 $i$ 和他的每一种可能的类型 $t_i \in T_i$ , 策略函数 $S_i^*\left(t_i\right)$ 所对应的行动 $a_i$ 都能最大化其期望得
益：
$\max _{a_i \in A_i} \sum_{t=i}\left\{u_i\left[S_i^*\left(t_1\right), \cdots, S_{i-1}^*, a_i, S_{i+1}^*\left(t_{i+1}\right), \cdots, S_n^*\left(t_n\right), t_i\right] p\left(t_{-i} \mid t_i\right)\right\}$
则称策略组合 $S^*=\left(S_1^*, \cdots, S_n^*\right)$ 为 $G$ 的一个 (纯策略) 贝叶斯纳什均衡。

另：即使某博弈方清楚自己的实际类型 $t_i$ ，但仍需对每种可能类型 $t_i\in T_i$ 都设定行动：因为别的博弈方的行为要根据本博弈方的不同类型来计算

例：

6.2 暗标拍卖

假设：

(1) 两投标者：博弈方1、博弈方 2
(2) 两博弈方对拍品估价: $v_1, v_2$
(3) 若标价 $b_i$ 中标, 其得益: $v_i-b_i$
(4) 各博弈方不知对方估价, 但知对方估价是 $[0, 1]$ 上的均匀分布，即取 $[0, 1]$ 中任何数值的概率相等。
(5) 博弈方都风险中性：一单位期望得益和一单位确定性得益价值相同。
表示为不完全信息静态博弈

把上述问题表示为标准的不完全信息静态博弈, 需要找出两个博弈方的行为空间、类型空间、判断和得益函数。
- 行为空间：博弈方 $i$ 的行为就是自己的标价 $b_i$ ,其中 $0\leq b_i\leq v_i\leq 1$
- 类型空间：博弈方 $i$ 的类型即自己的估价 $v_i$ , 类型空间 $T_i$ 就是估价可能取值区间 $[0, 1]$
- 判断：博弈方知道对方的类型是 $[0, 1]$ 上的标准分布, 这就是他们对对方类型的判断。
- 得益函数：
  $u_i=u_i\left(b_1, b_2, v_1, v_2\right)=\left\{\begin{array}{c} v_i-b_i, \text { 当 } b_i>b_j \\ \left(v_i-b_i\right) / 2, \text { 当 } b_i=b_j \\ 0, \text { 当 } b_i<b_j \end{array}\right.$
  式中 $i = 1$ 时 $j = 2, i = 2$ 时 $j = 1$ 。
寻找贝叶斯纳什均衡
- 先要构筑两博弈方的策略空间，即根据类型决定行为的函数关系：
  
  本博弈中, 博弈方 $i$ 的策略是符合要求的函数关系 $b_i\left(v_i\right)$ , 所有这种函数关系 $b_i\left(v_i\right)$ 的集合构成博弈方 $i$ 的策略空间。
- 分析贝叶斯均衡
  
  策略组合 $\left[b_1\left(v_1\right), b_2\left(v_2\right)\right]$ 是一个贝叶斯纳什均衡, 意味着博弈方 1 的策略 $b_1\left(v_1\right)$ 与博弈方 2 的策略 $b_2\left(v_2\right)$ 相互是对对方的最佳反应,对每个博弈方 $i$ 的每个类型 $v_i \in[0,1], b_i\left(v_i\right)$ 都满足中标的期望得益最大化：
  $\operatorname{Max}_{b_i}\left\{\left[v_i-b_i\left(v_{\mathrm{i}}\right)\right] P\left(b_i>b_j\right)+1 / 2\left[v_i-b_i\left(v_{\mathrm{i}}\right)\right] P\left(b_i=b_j\right)\right\}$
实例：线性策略函数的贝叶斯纳什均衡
- 假设博弈方的报价：由基价和估价的一个固定比例组成，即：
  $b_1\left(v_1\right)=a_1+c_1 v_1, \quad b_2\left(v_2\right)=a_2+c_2 v_2$
  其中 $a_1<1 、 a_2<1$ ; $c_1 \geq 0 、 c_2 \geq 0$
- 简化：由于 $v_j$ 服从标准分布, $b_j=b_j\left(v_j\right)=a_j+c_jv_j$ , 也服从标准分布, 因此 $P\left\{b_i=b_j\right\}=0$ （概率趋近于0）。这样上式变为:
  $\begin{aligned} & \max _{b_i}\left(v_i-b_i\right) P\left\{b_i>a_j+c_j v_j\right\} \\ = & \max _{b_i}\left(v_i-b_i\right) P\left\{v_j<\frac{b_i-a_j}{c_j}\right\} \\ = & \max _{b_i}\left(v_i-b_i\right) \frac{b_i-a_j}{c_j} \end{aligned}$
  求一阶导可得： $b_i=\left(a_j+v_i\right) / 2$
- 分析：
  
  当 $v_i<a_j$ （博弈方 $i$ 估价小于博弈方 $j$ 的基价）则博弈方 $i$ 一定不会中标，所以 $v_i$ 大小至少为 $a_j$ 才有希望，综合来看， $v_i$ 的最佳反应为：
  $b_i\left(v_i\right)= \begin{cases}\frac{v_i+a_j}{2} & \text { 当 } v_i \geqslant a_j \\ a_j & \text { 当 } v_i<a_j\end{cases}$
  若要求双方策略是严格的线性函数，可以要求 $a_j \leq 0$ ，这样 $v_i$ 的最佳反应变为：
  $b_i\left(v_i\right)=\frac{v_i+a_j}{2}$
  将此式与之前的策略空间 $b_i\left(v_i\right)=a_i+c_i v_i$ 相比较，最终可得$a_i=a_j / 2, c_i=1 / 2 $，另一个博弈方同理，联立得最终结果：
  $a_i=a_j=0, c_i=c_j=1 / 2$
  计算出 $b_i=v_i/2$ ,即博弈方最佳策略：把报价定为对拍品估价的一半。

上述贝叶斯纳什均衡是在上述暗标拍卖博弈中, 双方采用线性策略时唯一的贝叶斯纳什均衡。如果没有限定采用线性策略, 贝叶斯纳什均衡会发生改变。如果博弈方估价的概率分布不是上述标准分布, 暗标拍卖博弈的贝叶斯纳什均衡也会发生变化。此外,参与投标人数更多时情况也要更复杂一些,但分析思路是相同的。

Summary

此部分用于对所学内容的快速梳理记忆

不完全信息静态博弈和贝叶斯纳什均衡
- 暗标拍卖和古诺模型两个例子的简要介绍
- 一般表示方法 $G=\{A,T,p,u\}$
- 海撒尼均衡的四个转化步骤
  - 引进博弈方自然
  - 表示不完全信息
  - 博弈方进行静态博弈
  - 表示得益
- 贝叶斯纳什均衡：一种更强的概念：
  
  如果对任意博弈方 $i$ 和他的每一种可能的类型 $t_i \in T_i$ , 策略函数 $S_i^*\left(t_i\right)$ 所对应的行动 $a_i$ 都能最大化其期望得益
  
  $\max _{a_i \in A_i} \sum_{t=i}\left\{u_i\left[S_i^*\left(t_1\right), \cdots, S_{i-1}^*, a_i, S_{i+1}^*\left(t_{i+1}\right), \cdots, S_n^*\left(t_n\right), t_i\right] p\left(t_{-i} \mid t_i\right)\right\}$
  联想古诺模型中的 $\max _{q_1}\left\{\theta\left[a-q_1-q_2^{*}\left(c_H\right)-c_1\right] q_1+(1-\theta)\left[a-q_1-q_2^*({c_L})-c_1\right] q_1\right\}$
  
  求和实际上是求期望
暗标拍卖
- 从行为空间、类型空间、判断、得益函数四个方面去考虑，表示成不完全信息博弈
- 进行贝叶斯纳什均衡分析，首先要构筑博弈方的策略空间，之后进行分析。