对策论基础【提纲】
§15 对策论基础
C1 对策
1)基本要素:
-
局中人
:决策行动的参与者 -
策略集
:每一位参与者的决策行为集合 -
局势集
:笛卡尔积 -
获利/支付函数
:评价某一局势下参与者的获利
2)决策问题的分类:
- 局中人个数:二人对策、多人对策
- 获利函数代数和:零和对策、非零和对策
- 局中人策略集是否有限:有限对策、无限对策
- 是否合作:合作对策、非合作对策
C2 矩阵对策
1)矩阵对策
:二人 有限 零和 对策
- 记法约定:局中人Ⅰ Ⅱ,策略集,获利矩阵。对策:
2)平衡局势
:
-
称为
矩阵对策G的值
,对应的为最优纯策略
-
平衡局势存在的充要条件:(行中最小列中最大),即存在鞍点
-
鞍点性质:
- 无差别性:两鞍点的获利取值相同
- 可交换性:若是鞍点,则也是鞍点
3)混合策略
:允许策略为策略集集上一个概率分布。
- 策略集:
- 获利函数:
- 显然,纯策略是的特例
- 平衡局势:
- 注意到,即Ⅰ的有把握最大获利不会大于Ⅱ的有把握最低损失
4)矩阵对策基本定理:矩阵对策总是存在最优混合策略
-
记Ⅰ采取纯策略时,相应的赢得函数为
记Ⅱ采取纯策略时,相应的赢得函数为
则有
-
平衡局势存在的其它充要条件:
-
-
以下两个方程组有同解
-
此时
-
-
基本定理的构造性证明:求解以下对偶线性规划问题
-
最优混合策略的性质:
设为矩阵对策的解,,则
-
5)记矩阵对策的解集
为
-
设有2个矩阵对策,其中
则有
-
设有2个矩阵对策
则有
-
若为斜对称矩阵(,又称对称对策),则。为Ⅰ,Ⅱ最优策略集
6)优超策略
:,称策略优超。即无论Ⅱ做出何种决策,策略总是比获利更多
-
若被其余所有策略优超,或被其线性组合优超,去除该策略对应的行,新对策的最优解仍是原对策最优解。
(注意到,这种表述说明可能导致解集变小,但是不会发生变化)
7)解法:
-
通过优超策略的化简,有时可化为简单的形式
- 矩阵对策:先寻找鞍点,若无鞍点,解方程组
- 矩阵对策:图解法。做两垂线。0处做垂线标注,1处做垂线标注。连接,最低交点为所求
-
线性方程组方法:注意利用最优混合策略的性质化简矩阵
若无非负解,需要将部分等式改为不等式,根据共轭定理对偶使一些量为0 -
线性规划方法:
-
先查找鞍点
-
再验证是否满足
-
求解矩阵对策,即:
一般从Ⅱ开始解,可以在开始就找到一个基本可行解 -
由解集性质得到原对策的解
-
C3 其它类型对策简介
1)二人无限零和对策:
-
最优纯策略:
-
混合策略:策略为策略集上一个连续型概率分布
-
获利函数:
-
最优混合策略:
-
-
连续对策:
- 连续对策一定有最优混合策略
2)多人非合作对策:
-
局中人:
-
局势:,记更换局势分量i(局中人i改变策略)为
-
获利函数:
-
纯策略平衡局势:,即所有人在该局势下改变策略不会带来更多获利
-
混合局势:为局中人的一个混合策略。为该局势下局中人的获利期望,局中人改变策略为:
混合策略平衡局势:
-
Nash定理:非合作n人对策在混合策略意义下的平衡局势一定存在
- 特化:二人有限非零和对策(双矩阵对策)
3)合作对策:允许形成联盟