【博弈论笔记】第六章 不完全信息静态表示

此部分博弈论笔记参考自经济博弈论(第四版)/谢识予和老师的PPT,是在平时学习中以及期末备考中整理的,主要注重对本章节知识点的梳理以及重点知识的理解,细节和逻辑部分还不是很完善,可能不太适合初学者阅读(看书应该会理解的更明白O(∩_∩)O哈哈~)。现更新到博客上供大家浏览,希望能够帮助到正在学习博弈论的大家。

第六章 不完全信息静态表示

6.1 不完全信息静态博弈和贝叶斯纳什均衡

在一个静态博弈中,至少有一个博弈方不完全清楚其他某些博弈方的策略或得益等信息,但知道其策略或得益等信息空间的概率分布,这种博弈叫不完全信息静态博弈,也叫贝叶斯博弈。

6.1.1 不完全信息静态博弈的例子

  1. 暗标拍卖

    暗标拍卖通常有这样几个基本特征:(1)密封递交标书; (2)统一时间公证开标; (3) 标价最高者以所报标价中标。

    • 由于博弈方的标书密封递交和同时开标, 各博弈方在选择策略之前都无法知道其他博弈方策略, 而且是一次性选择, 因此这是静态博弈问题。
    • 各博弈方无法知道确知其他博弈方拍得标的物的得益,最多能根据一般情况或以往经验作大致判断。 这意味着, 暗标拍卖博弈是不完全信息博恋, 且是不完全信息静态博弈。
  2. 古诺模型

    • 假设:两寡头同时作产量 决策, 市场需求为 P ( Q ) = a − Q , Q = q 1 + q 2 P(Q)=a-Q, Q=q_1+q_2 P(Q)=aQ,Q=q1+q2 为市场总产量, q 1 、 q 2 q_1 、 q_2 q1q2 分别是两个厂商产量。厂商 1 成本函数 C 1 = C 1 ( q 1 ) = c 1 q 1 C_1=C_1\left(q_1\right)=c_1 q_1 C1=C1(q1)=c1q1, 即无固定成本, 边际成本为 c 1 c_1 c1, 这是两个厂商都知道的。厂商 2 的成本有两种可能情 况, 一种 C 2 = C 2 ( q 2 ) = c H q 2 C_2=C_2\left(q_2\right)=c_H q_2 C2=C2(q2)=cHq2, 另一种 C 2 = C 2 ( q 2 ) = c L q 2 C_2=C_2\left(q_2\right)=c_L q_2 C2=C2(q2)=cLq2, 而 c H > c L c_H>c_L cH>cL, 究 竟是哪种成本厂商 2 自己知道,厂商 1 只知道前一种的概率 θ \theta θ, 后一种的概率 1 − θ 1-\theta 1θ

    • 分析:

      • 当高成本, q 2 ∗ ( c H ) q_{2}{ }^*\left(c_{H}\right) q2(cH) 满足: max ⁡ q 2 [ ( a − q 1 − q 2 ) − c H ] q 2 \max _{q_2}\left[\left(a-q_1-q_2\right)-c_{\mathrm{H}}\right] q_2 maxq2[(aq1q2)cH]q2
      • 当低成本, q 2 ∗ ( c L ) \mathbf{q}_{\mathbf{2}}{ }^*\left(\mathbf{c}_{\mathbf{L}}\right) q2(cL) 满足: max ⁡ q 1 [ ( a − q 1 − q 2 ) − c L ] q 2 \max_{q_1} \left[\left(a-q_1-q_2\right)-c_L\right] q_2 maxq1[(aq1q2)cL]q2
      • 厂商一的策略: max ⁡ q 1 { θ [ a − q 1 − q 2 ∗ ( c H ) − c 1 ] q 1 + ( 1 − θ ) [ a − q 1 − q 2 ∗ ( c L ) − c 1 ] q 1 } \max _{q_1}\left\{\theta\left[a-q_1-q_2^{*}\left(c_H\right)-c_1\right] q_1+(1-\theta)\left[a-q_1-q_2^*({c_L})-c_1\right] q_1\right\} maxq1{ θ[aq1q2(cH)c1]q1+(1θ)[aq1q2(cL)c1]q1}
    • 求解:三个式子各自求极值,然后联立求解,得:
      q 2 ∗ ( c H ) = a − 2 c H + c 1 3 + 1 − θ 6 ( c H − c L ) q 2 ∗ ( c L ) = a − 2 c L + c 1 3 − θ 6 ( c H − c L ) q 1 ∗ = a − 2 c 1 + θ c H + ( 1 − θ ) c L 3 \begin{aligned} & q_2^*\left(c_H\right)=\frac{a-2 c_H+c_1}{3}+\frac{1-\theta}{6}\left(c_H-c_L\right) \\ & q_2^*\left(c_L\right)=\frac{a-2 c_L+c_1}{3}-\frac{\theta}{6}\left(c_H-c_L\right) \\ & q_1^*=\frac{a-2 c_1+\theta c_H+(1-\theta) c_L}{3} \end{aligned} q2(cH)=3a2cH+c1+61θ(cHcL)q2(cL)=3a2cL+c16θ(cHcL)q1=3a2c1+θcH+(1θ)cL

    • 讨论:当 c 2 = c H c_2=c_H c2=cH时, q 2 ∗ ( c H ) > q 2 ∗ q_2^*(c_H)>q_2^* q2(cH)>q2,当 c 2 = c L c_2=c_L c2=cL时, q 2 ∗ ( c L ) < q 2 ∗ q_2^*(c_L)<q_2^* q2(cL)<q2.

      当厂商2实际高成本时,他本应生产较少,但他考虑到对方不知道自己高成本, 所以对方选择的产量会小于知道自已高成本时的最佳产量, 因此自己可以适当多生产一些。

6.1.2 不完全信息静态博弈的一般表示

在完全信息静态博弈时,我们将其表示为: G = { S 1 , ⋯   , S n ; u 1 , ⋯   , u n } G=\left\{S_1, \cdots, S_n ; u_1, \cdots, u_n\right\} G={ S1,,Sn;u1,,un},

其中 S i S_i Si 是博弈方 i i i 的策略空间, 即全部可选策略的集合, u i u_i ui 是其得益函数 u i = u i ( s 1 , ⋯   , s n ) u_i=u_i\left(s_1, \cdots, s_n\right) ui=ui(s1,,sn)

到了不完全信息静态博弈中,需要表示信息的不完全性,用 T T T来表示: t i t_i ti 表示博弈方 i i i 的类型, T T T ,表示博弈方 i i i 的类型空间 t i ∈ T i , u i ( a 1 , ⋯   , a n , t i ) t_i \in T_i, u_i\left(a_1, \cdots, a_n, t_i\right) tiTi,ui(a1,,an,ti) 表示博弈方 i i i 在策略组合 ( a 1 , ⋯   , a n ) \left(a_1, \cdots, a_n\right) (a1,,an) 下的得益。信息不完全可以通过 t i t_i ti 的取值只有博弈方 i i i 知道而其他博弈方不清楚这一情况来反映。

另一个需要添加的是博弈方对不完全信息概率的判断:如果用博弈方 i i i 在自己类型为 t i t_i ti 的前提下, 对其他博弈方类型的所有可能(或类型组合) = ( t 1 , ⋯   =\left(t_1, \cdots\right. =(t1, t i − 1 , t i + 1 , ⋯   , t n ) \left.t_{i-1}, t_{i+1}, \cdots, t_n\right) ti1,ti+1,,tn) 的条件概率 p i = p i { t − i ∣ t i } p_i=p_i\left\{t_{-i} \mid t_i\right\} pi=pi{ titi}, 作为反映不完全信息的概率判断, 则可用 G = { A 1 , ⋯   , A n ; T 1 , ⋯   , T n ; p 1 , ⋯   , p n ; u 1 , ⋯   , u n } G=\left\{A_1, \cdots, A_n ; T_1, \cdots, T_n ; p_1, \cdots, p_n ; u_1, \cdots ,u_n\right\} G={ A1,,An;T1,,Tn;p1,,pn;u1,,un}表示不完全信息静态博弈问题。

以不完全信息古诺博弈为例:
 厂商  1  的行动空间-  A 1 = { q 1 }  厂商  2  的行动空间-  A 2 = { q 2 }  厂商  1  的类型空间-  T 1 = { c 1 }  厂商  2  的类型空间-  T 2 = { c H , c L }  厂商  1  的得益- -  u 1 = π 1 ( q 1 , q 2 , t 1 )  厂商  2  的得益–  u 2 = π 2 ( q 1 , q 2 , t 2 )  厂商  1  条件概率-  p 1 { c H ∣ c 1 } = θ ; p 1 { c L ∣ c 1 } = 1 − θ  厂商  2  条件概率-  p 2 { c 1 ∣ c H } = 1 ; p 2 { c 1 ∣ c L } = 1 \begin{aligned} & \text { 厂商 } 1 \text { 的行动空间- } A_1=\left\{q_1\right\} \\ & \text { 厂商 } 2 \text { 的行动空间- } A_2=\left\{q_2\right\} \\ & \text { 厂商 } 1 \text { 的类型空间- } T_1=\left\{c_1\right\} \\ & \text { 厂商 } 2 \text { 的类型空间- } T_2=\left\{c_H, c_L\right\} \\ & \text { 厂商 } 1 \text { 的得益- - } u_1=\pi_1\left(q_1, q_2, t_1\right) \\ & \text { 厂商 } 2 \text { 的得益-- } u_2=\pi_2\left(q_1, q_2, t_2\right)\\ & \text { 厂商 } 1 \text { 条件概率- } p_1\{c_H|c_1\}=\theta;p_1\{c_L|c_1\}=1-\theta\\ &\text { 厂商 } 2 \text { 条件概率- } p_2\{c_1|c_H\}=1; p_2\{c_1|c_L\}=1 \end{aligned}  厂商 1 的行动空间A1={ q1} 厂商 2 的行动空间A2={ q2} 厂商 1 的类型空间T1={ c1} 厂商 2 的类型空间T2={ cH,cL} 厂商 1 的得益- - u1=π1(q1,q2,t1) 厂商 2 的得益– u2=π2(q1,q2,t2) 厂商 1 条件概率p1{ cHc1}=θ;p1{ cLc1}=1θ 厂商 2 条件概率p2{ c1cH}=1;p2{ c1cL}=1

6.1.3 海萨尼均衡

海萨尼( Harsanyi )1967年提出将“不完全信息静态博弈” 转化为“完全但不完美信息动态博弈”:

  • 第一步:引进虚拟博弈方 “自然”, “自然”进行动态博弈第一阶段的行动选择
    • “自然” 为每个博弈方随机选择类型 t = ( t 1 , … , t n ) t=\left(t_1, \ldots, t_n\right) t=(t1,,tn)其中 t i ∈ T i , i = 1 , ⋯   , n t_i \in T_i, i=1, \cdots, n tiTi,i=1,,n
  • 第二步:表示不完全信息
    • 每个博弈方知道自己的类型,但不知道“自然”为其他博弈方选择的类型,只知道所选类型的概率分布。
  • 第三步:博弈方在动态博弈第二阶段进行原来的静态博弈 a 1 , … , a n a_1, \ldots, a_n a1,,an
  • 第四步:表示得益
    • 除 “自然” 博弈方外, 其余博弈方各自得益 u i = u i ( a 1 , … , a n u_i=u_i\left(a_1, \ldots, a_n\right. ui=ui(a1,,an, t i ) \left.t_i\right) ti)

在作了海萨尼转换之后, 仍然有对 “类型” 的判断问题。但这时对类型的判断形式上变成了对博弈进程,即 “自然”对实际博弈方类型选择的判断, 其概率分布与类型的概率分布相同, 即 “自然”以概率分布 p 1 , ⋯ p_1, \cdots p1,, p n p_n pn 分别选择 t 1 , ⋯   , t n t_1, \cdots, t_n t1,,tn

6.1.4 贝叶斯纳什均衡

将纳什均衡推广到不完全信息静态博弈中,基本思想与完全信息静态博弈的纳什均衡是一样的, 各博弈方的策略必须是对其他博弈方策略(或策略组合)的最佳反应。不同的是, 这里的策略比完全信息静态博弈复杂一些,不是简单的行为选择,而是由类型决定行为选择的函数。这种策略有新含义的纳什均衡, 称为 “贝叶斯纳什均衡”。

定义在不完全信息静态博弈 G = { A 1 , ⋯   , A n ; T 1 , ⋯   , T n G=\left\{A_1, \cdots, A_n ; T_1, \cdots, T_n\right. G={ A1,,An;T1,,Tn; p 1 , ⋯   , p n ; u 1 , ⋯   , u n } \left.p_1, \cdots, p_n ; u_1, \cdots, u_n\right\} p1,,pn;u1,,un} 中, 如果对任意博弈方 i i i 和他的每一种可能的类型 t i ∈ T i t_i \in T_i tiTi, 策略函数 S i ∗ ( t i ) S_i^*\left(t_i\right) Si(ti) 所对应的行动 a i a_i ai 都能最大化其期望得
益:
max ⁡ a i ∈ A i ∑ t = i { u i [ S i ∗ ( t 1 ) , ⋯   , S i − 1 ∗ , a i , S i + 1 ∗ ( t i + 1 ) , ⋯   , S n ∗ ( t n ) , t i ] p ( t − i ∣ t i ) } \max _{a_i \in A_i} \sum_{t=i}\left\{u_i\left[S_i^*\left(t_1\right), \cdots, S_{i-1}^*, a_i, S_{i+1}^*\left(t_{i+1}\right), \cdots, S_n^*\left(t_n\right), t_i\right] p\left(t_{-i} \mid t_i\right)\right\} aiAimaxt=i{ ui[Si(t1),,Si1,ai,Si+1(ti+1),,Sn(tn),ti]p(titi)}
则称策略组合 S ∗ = ( S 1 ∗ , ⋯   , S n ∗ ) S^*=\left(S_1^*, \cdots, S_n^*\right) S=(S1,,Sn) G G G 的一个 (纯策略) 贝叶斯纳什均衡。

另:即使某博弈方清楚自己的实际类型 t i t_i ti,但仍需对每种可能类型 t i ∈ T i t_i\in T_i tiTi都设定行动:因为别的博弈方的行为要根据本博弈方的不同类型来计算

例:

image-20230608212743756

6.2 暗标拍卖

  1. 假设:

    (1) 两投标者:博弈方1、博弈方 2
    (2) 两博弈方对拍品估价: v 1 , v 2 v_1, v_2 v1,v2
    (3) 若标价 b i b_i bi 中标, 其得益: v i − b i v_i-b_i vibi
    (4) 各博弈方不知对方估价, 但知对方估价是 [ 0 , 1 ] [0,1] [0,1] 上的均匀分布,即取 [ 0 , 1 ] [0,1] [0,1] 中任何数值的概率相等。
    (5) 博弈方都风险中性:一单位期望得益和一单位确定性得益价值相同。

  2. 表示为不完全信息静态博弈

    把上述问题表示为标准的不完全信息静态博弈, 需要找出两个博弈方的行为空间、类型空间、判断和得益函数。

    • 行为空间:博弈方 i i i的行为就是自己的标价 b i b_i bi,其中 0 ≤ b i ≤ v i ≤ 1 0\leq b_i\leq v_i\leq 1 0bivi1

    • 类型空间:博弈方 i i i 的类型即自己的估价 v i v_i vi, 类型空间 T i T_i Ti 就是 估价可能取值区间 [ 0 , 1 ] [0,1] [0,1]

    • 判断:博弈方知道对方的类型是 [ 0 , 1 ] [0,1] [0,1] 上的 标准分布, 这就是他们对对方类型的判断。

    • 得益函数:
      u i = u i ( b 1 , b 2 , v 1 , v 2 ) = { v i − b i ,  当  b i > b j ( v i − b i ) / 2 ,  当  b i = b j 0 ,  当  b i < b j u_i=u_i\left(b_1, b_2, v_1, v_2\right)=\left\{\begin{array}{c} v_i-b_i, \text { 当 } b_i>b_j \\ \left(v_i-b_i\right) / 2, \text { 当 } b_i=b_j \\ 0, \text { 当 } b_i<b_j \end{array}\right. ui=ui(b1,b2,v1,v2)= vibi,  bi>bj(vibi)/2,  bi=bj0,  bi<bj
      式中 i = 1 i=1 i=1 j = 2 , i = 2 j=2, i=2 j=2,i=2 j = 1 j=1 j=1

  3. 寻找贝叶斯纳什均衡

    • 先要构筑两博弈方的策略空间,即根据类型决定行为的函数关系:

      本博弈中, 博弈方 i i i 的策略是符合要求的函数关系 b i ( v i ) b_i\left(v_i\right) bi(vi), 所有这种函数关系 b i ( v i ) b_i\left(v_i\right) bi(vi) 的集合构成博弈方 i i i 的策略空间。

    • 分析贝叶斯均衡

      策略组合 [ b 1 ( v 1 ) , b 2 ( v 2 ) ] \left[b_1\left(v_1\right), b_2\left(v_2\right)\right] [b1(v1),b2(v2)] 是一个贝叶斯纳什均 衡, 意味着博弈方 1 的策略 b 1 ( v 1 ) b_1\left(v_1\right) b1(v1) 与博弈方 2 的策略 b 2 ( v 2 ) b_2\left(v_2\right) b2(v2) 相互是对对方的最佳反应,对每个博弈方 i i i 的每个类型 v i ∈ [ 0 , 1 ] , b i ( v i ) v_i \in[0,1], b_i\left(v_i\right) vi[0,1],bi(vi) 都满足中标的期望得益最大化:
      Max ⁡ b i { [ v i − b i ( v i ) ] P ( b i > b j ) + 1 / 2 [ v i − b i ( v i ) ] P ( b i = b j ) } \operatorname{Max}_{b_i}\left\{\left[v_i-b_i\left(v_{\mathrm{i}}\right)\right] P\left(b_i>b_j\right)+1 / 2\left[v_i-b_i\left(v_{\mathrm{i}}\right)\right] P\left(b_i=b_j\right)\right\} Maxbi{ [vibi(vi)]P(bi>bj)+1/2[vibi(vi)]P(bi=bj)}

  4. 实例:线性策略函数的贝叶斯纳什均衡

    • 假设博弈方的报价:由基价和估价的一个固定比例组成,即:
      b 1 ( v 1 ) = a 1 + c 1 v 1 , b 2 ( v 2 ) = a 2 + c 2 v 2 b_1\left(v_1\right)=a_1+c_1 v_1, \quad b_2\left(v_2\right)=a_2+c_2 v_2 b1(v1)=a1+c1v1,b2(v2)=a2+c2v2
      其中 a 1 < 1 、 a 2 < 1 a_1<1 、 a_2<1 a1<1a2<1; c 1 ≥ 0 、 c 2 ≥ 0 c_1 \geq 0 、 c_2 \geq 0 c10c20

    • 简化:由于 v j v_j vj 服从标准分布, b j = b j ( v j ) = a j + c j v j b_j=b_j\left(v_j\right)=a_j+c_jv_j bj=bj(vj)=aj+cjvj, 也服从标准分布, 因此 P { b i = b j } = 0 P\left\{b_i=b_j\right\}=0 P{ bi=bj}=0(概率趋近于0) 。这样上式变为:
      max ⁡ b i ( v i − b i ) P { b i > a j + c j v j } = max ⁡ b i ( v i − b i ) P { v j < b i − a j c j } = max ⁡ b i ( v i − b i ) b i − a j c j \begin{aligned} & \max _{b_i}\left(v_i-b_i\right) P\left\{b_i>a_j+c_j v_j\right\} \\ = & \max _{b_i}\left(v_i-b_i\right) P\left\{v_j<\frac{b_i-a_j}{c_j}\right\} \\ = & \max _{b_i}\left(v_i-b_i\right) \frac{b_i-a_j}{c_j} \end{aligned} ==bimax(vibi)P{ bi>aj+cjvj}bimax(vibi)P{ vj<cjbiaj}bimax(vibi)cjbiaj
      求一阶导可得: b i = ( a j + v i ) / 2 b_i=\left(a_j+v_i\right) / 2 bi=(aj+vi)/2

    • 分析:

      v i < a j v_i<a_j vi<aj (博弈方 i i i 估价小于博弈方 j j j 的基价)则博弈方 i i i 一定不会中标,所以 v i v_i vi大小至少为 a j a_j aj才有希望,综合来看, v i v_i vi的最佳反应为:
      b i ( v i ) = { v i + a j 2  当  v i ⩾ a j a j  当  v i < a j b_i\left(v_i\right)= \begin{cases}\frac{v_i+a_j}{2} & \text { 当 } v_i \geqslant a_j \\ a_j & \text { 当 } v_i<a_j\end{cases} bi(vi)={ 2vi+ajaj  viaj  vi<aj
      若要求双方策略是严格的线性函数,可以要求 a j ≤ 0 a_j \leq 0 aj0,这样 v i v_i vi的最佳反应变为:
      b i ( v i ) = v i + a j 2 b_i\left(v_i\right)=\frac{v_i+a_j}{2} bi(vi)=2vi+aj
      将此式与之前的策略空间 b i ( v i ) = a i + c i v i b_i\left(v_i\right)=a_i+c_i v_i bi(vi)=ai+civi相比较,最终可得$a_i=a_j / 2, c_i=1 / 2 $,另一个博弈方同理,联立得最终结果:
      a i = a j = 0 , c i = c j = 1 / 2 a_i=a_j=0, c_i=c_j=1 / 2 ai=aj=0,ci=cj=1/2
      计算出 b i = v i / 2 b_i=v_i/2 bi=vi/2,即博弈方最佳策略:把报价定为对拍品估价的一半。

上述贝叶斯纳什均衡是在上述暗标拍卖博弈中, 双方采用线性策略时唯一的贝叶斯纳什均衡。如果没有限定采用线性策略, 贝叶斯纳什均衡会发生改变。如果博弈方估价的概率分布不是上述标准分布, 暗标拍卖博弈的贝叶斯纳什均衡也会发生变化。此外,参与投标人数更多时情况也要更复杂一些,但分析思路是相同的。

Summary

此部分用于对所学内容的快速梳理记忆

  1. 不完全信息静态博弈和贝叶斯纳什均衡

    • 暗标拍卖和古诺模型两个例子的简要介绍

    • 一般表示方法 G = { A , T , p , u } G=\{A,T,p,u\} G={ A,T,p,u}

    • 海撒尼均衡的四个转化步骤

      • 引进博弈方自然
      • 表示不完全信息
      • 博弈方进行静态博弈
      • 表示得益
    • 贝叶斯纳什均衡:一种更强的概念:

      如果对任意博弈方 i i i 和他的每一种可能的类型 t i ∈ T i t_i \in T_i tiTi, 策略函数 S i ∗ ( t i ) S_i^*\left(t_i\right) Si(ti) 所对应的行动 a i a_i ai 都能最大化其期望得益

      max ⁡ a i ∈ A i ∑ t = i { u i [ S i ∗ ( t 1 ) , ⋯   , S i − 1 ∗ , a i , S i + 1 ∗ ( t i + 1 ) , ⋯   , S n ∗ ( t n ) , t i ] p ( t − i ∣ t i ) } \max _{a_i \in A_i} \sum_{t=i}\left\{u_i\left[S_i^*\left(t_1\right), \cdots, S_{i-1}^*, a_i, S_{i+1}^*\left(t_{i+1}\right), \cdots, S_n^*\left(t_n\right), t_i\right] p\left(t_{-i} \mid t_i\right)\right\} aiAimaxt=i{ ui[Si(t1),,Si1,ai,Si+1(ti+1),,Sn(tn),ti]p(titi)}
      联想古诺模型中的 max ⁡ q 1 { θ [ a − q 1 − q 2 ∗ ( c H ) − c 1 ] q 1 + ( 1 − θ ) [ a − q 1 − q 2 ∗ ( c L ) − c 1 ] q 1 } \max _{q_1}\left\{\theta\left[a-q_1-q_2^{*}\left(c_H\right)-c_1\right] q_1+(1-\theta)\left[a-q_1-q_2^*({c_L})-c_1\right] q_1\right\} maxq1{ θ[aq1q2(cH)c1]q1+(1θ)[aq1q2(cL)c1]q1}

      求和实际上是求期望

  2. 暗标拍卖

    • 从行为空间、类型空间、判断、得益函数四个方面去考虑,表示成不完全信息博弈
    • 进行贝叶斯纳什均衡分析,首先要构筑博弈方的策略空间,之后进行分析。

猜你喜欢

转载自blog.csdn.net/weixin_62012485/article/details/131355307