完全冲突博弈的线性规划模型之混合策略建模

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u011675745/article/details/75447578

简介

在棒球比赛中,投球手和击球手进行一种混合策略的博弈。考虑下面的表,击球手如果预测投球手会投出快球,按照投球手实际投出的快球或是弧线球,他击球将分别的得到0.4分或0.2分。同样,如果击球手预测投球手将投出弧线球,而按照投球手实际投出的球是快球或是弧线球,击球手分别可以得到0.1分或0.3分。
显然,在一场比赛中,投球手希望击球手的平均得分最小,而击球手希望自己的评分得分最高。

击球手 投球手
快球 弧线球
快球 0.4 0.2
弧线球 0.1 0.3

对击球手的决策进行建模

首先考虑对击球手进行建模,击球手希望采取一种策略,可以是某种弧线球和快球的组合,使得他的击球平均分达到最高。
我们先定义以下变量:

A 击球平均分
x 猜测快球的比例
1-x 猜测弧线球的比例

目标函数
击球手的目标是

maxA

约束
击球手面临着投球手的各种策略约束。例如投球手可以选择纯快球策略或纯弧线球策略。当然,这两种策略给击球手最大化平均分的能力施加了一个上限,即约束。
考虑投球手采取纯快球策略时,击球手这时的击球平均分不能超过此时对应的期望值,因此我们有约束:
A0.4x+0.1(1x)

同样,当投球手采取纯弧线球策略的时候,击球手的击球平均分同样不会超过此时对应的期望值,这时也有约束
A0.2x+0.3(1x)

因为击球手的猜测是一个概率,所以我们有
0x1

完整线性规划组合
组合起来,我们便有了击球手的下列优化方程
maxAs.t.A0.4x+0.1(1x)A0.2x+0.3(1x)0x1

求解击球手的决策模型

利用几何方法可以简单的得到我们想要的答案。

  • x=0 ,意味着击球手认为投球手会采取纯弧线球策略,因而他也会采用纯弧线球策略
  • x=1 ,意味着击球手认为投球手会采取纯快球策略,因而也是采取纯快球策略

将该线性规划所代表的图画出,如下:
击球手策略线性规划图
我们可以看出,该线性规划的唯一最优解在交点 (0.5,0.25) 处取得,我们可以对此做出下列解释

A=0.25 击球平均分
x=0.5 击球手预测的快球比例
1x=0.5 击球手预测的弧线球比例

因此,击球手应当以 50% 的概率猜测投球手会投出快球。如果击球手按照该方案进行击球,那么无论投球手采用纯弧线球策略还是纯快球策略,都可以得到0.25的分数,如果投球手采用混合策略进行投球。我们可以假设投球手以概率 y 投出快球,那么将以 1y 的概率投出弧线球,由于投球手无论是投出何种球,击球手的分数都是0.25。
所以无论投球手采取何种策略进行投球,当击球手按照该方案进行击球,都能保证得到0.25的均分。

敏感性分析

击球手的线性规划图不仅对于击球手有重要信息,对于投球手也同样头重要的信息。
敏感性分析
假设投球手观察到击球手猜测快球的概率低于 50% ,例如图中的A点所示的 25% ,那么投球手就该意识到,他应该采用图中B点的策略对击球手进行惩罚,使其平均分降至0.25以下。类似的,当击球手预测弧线球的概率大于 50% 时,投球手就可以改用图中D点所示的弧线球策略或在混合策略中增大弧线球的比例,对击球手进行惩罚。
这是显而易见的,当击球手预测快球概率比较低时,会更多的采用弧线球的击法,这时投球手就可以增大快球的比例,降低其分数。

对投球手的决策进行建模

同样的,我们需要考虑投球手的决策。我们要探求投球手的投球策略,以降低击球平均分。我们依旧定义以下变量:

扫描二维码关注公众号,回复: 6225449 查看本文章

A 击球平均分
y 投出快球的比例
1-y 投出弧线球的比例

目标函数
投球手的目标函数是

minA

约束
对于击球手,他有可能猜中全部的快球或弧线球。因此投球手同样有两个约束函数,该约束函数限定了投球手最小化击球平均分的下限。
首先,当投球手采取纯快球策略的时候,这时的击球平均分不会低于击球手采取纯快球策略时所对应的期望值,即:
A0.4y+0.2(1y)

同样的,当投球手采取纯弧线球策略的时候,这时的击球均分不会低于击球手采取纯弧线球策略时所对应的期望值,即:
A0.1y+0.3(1y)

因为投球手投出的球的比例是一个概率,所以我们有下列约束:
0y1

完整的线性规划
minAs.t.A0.4y+0.2(1y)A0.1y+0.3(1y)0y1

求解投球手的决策模型

同样利用几何方法可以简单的得到我们想要的答案。

  • y=0 代表了投球手采取纯弧线球策略
  • y=1 代表了投球手采取蠢快球册率

我们将该线性规划作图,如下:
投球手策略线性规划图
由图我们可以看出,若投球手希望最小化击球平均分的最优解在交点 (0.25,0.25) 处取得
我们对其做出下列解释

A=0.25 击球平均分
y=0.5 投球手应该投出快球的比例
1x=0.5 投球手应该投出弧线球的比例

因此,为了保证分数最低,投球手可以明确一点,他应该按照 25% 的概率投出快球以及 75% 的概率投出弧线球。当投球手按照此方案进行时,不论击球手以何种方案击球,都能保证击球平均分为0.25分。

敏感性分析

如同击球手的策略有一定的敏感性,投球手的策略也有一定的敏感性。投球手的策略分析对于击球手同样拥有重要的意义。
敏感性分析
如上图所示,当击球手观察到投球手投出的快球的比例低于 25% 的时候,例如只有上图A点所示的 10% ,也就是说,投球手比最优解投出了更多的弧线球,这时候,击球手就应该采取图中B点所示的弧线球策略对其进行惩罚,以提高击球平均分。

猜你喜欢

转载自blog.csdn.net/u011675745/article/details/75447578