完全冲突博弈的线性规划模型之混合策略建模
简介
在棒球比赛中,投球手和击球手进行一种混合策略的博弈。考虑下面的表,击球手如果预测投球手会投出快球,按照投球手实际投出的快球或是弧线球,他击球将分别的得到0.4分或0.2分。同样,如果击球手预测投球手将投出弧线球,而按照投球手实际投出的球是快球或是弧线球,击球手分别可以得到0.1分或0.3分。
显然,在一场比赛中,投球手希望击球手的平均得分最小,而击球手希望自己的评分得分最高。
击球手 | 投球手 | |
快球 | 弧线球 | |
快球 | 0.4 | 0.2 |
弧线球 | 0.1 | 0.3 |
对击球手的决策进行建模
首先考虑对击球手进行建模,击球手希望采取一种策略,可以是某种弧线球和快球的组合,使得他的击球平均分达到最高。
我们先定义以下变量:
A
→ 击球平均分
x→ 猜测快球的比例
1-x→ 猜测弧线球的比例
目标函数
击球手的目标是
约束
击球手面临着投球手的各种策略约束。例如投球手可以选择纯快球策略或纯弧线球策略。当然,这两种策略给击球手最大化平均分的能力施加了一个上限,即约束。
考虑投球手采取纯快球策略时,击球手这时的击球平均分不能超过此时对应的期望值,因此我们有约束:
同样,当投球手采取纯弧线球策略的时候,击球手的击球平均分同样不会超过此时对应的期望值,这时也有约束
因为击球手的猜测是一个概率,所以我们有
完整线性规划组合
组合起来,我们便有了击球手的下列优化方程
求解击球手的决策模型
利用几何方法可以简单的得到我们想要的答案。
- 当
x=0 ,意味着击球手认为投球手会采取纯弧线球策略,因而他也会采用纯弧线球策略 - 当
x=1 ,意味着击球手认为投球手会采取纯快球策略,因而也是采取纯快球策略
将该线性规划所代表的图画出,如下:
我们可以看出,该线性规划的唯一最优解在交点
A=0.25→ 击球平均分x=0.5→ 击球手预测的快球比例1−x=0.5→ 击球手预测的弧线球比例
因此,击球手应当以
所以无论投球手采取何种策略进行投球,当击球手按照该方案进行击球,都能保证得到0.25的均分。
敏感性分析
击球手的线性规划图不仅对于击球手有重要信息,对于投球手也同样头重要的信息。
假设投球手观察到击球手猜测快球的概率低于
这是显而易见的,当击球手预测快球概率比较低时,会更多的采用弧线球的击法,这时投球手就可以增大快球的比例,降低其分数。
对投球手的决策进行建模
同样的,我们需要考虑投球手的决策。我们要探求投球手的投球策略,以降低击球平均分。我们依旧定义以下变量:
A
→ 击球平均分
y→ 投出快球的比例
1-y→ 投出弧线球的比例
目标函数
投球手的目标函数是
约束
对于击球手,他有可能猜中全部的快球或弧线球。因此投球手同样有两个约束函数,该约束函数限定了投球手最小化击球平均分的下限。
首先,当投球手采取纯快球策略的时候,这时的击球平均分不会低于击球手采取纯快球策略时所对应的期望值,即:
同样的,当投球手采取纯弧线球策略的时候,这时的击球均分不会低于击球手采取纯弧线球策略时所对应的期望值,即:
因为投球手投出的球的比例是一个概率,所以我们有下列约束:
完整的线性规划
求解投球手的决策模型
同样利用几何方法可以简单的得到我们想要的答案。
-
y=0 代表了投球手采取纯弧线球策略 -
y=1 代表了投球手采取蠢快球册率
我们将该线性规划作图,如下:
由图我们可以看出,若投球手希望最小化击球平均分的最优解在交点
我们对其做出下列解释
A=0.25→ 击球平均分y=0.5→ 投球手应该投出快球的比例1−x=0.5→ 投球手应该投出弧线球的比例
因此,为了保证分数最低,投球手可以明确一点,他应该按照
敏感性分析
如同击球手的策略有一定的敏感性,投球手的策略也有一定的敏感性。投球手的策略分析对于击球手同样拥有重要的意义。
如上图所示,当击球手观察到投球手投出的快球的比例低于