对策论基础【提纲】

§15 对策论基础

C1 对策

1)基本要素:

  • 局中人 II:决策行动的参与者
  • 策略集 Si,iIS_i,i\in I:每一位参与者的决策行为集合
  • 局势集:笛卡尔积 S=S1×S2××SnS = S_1 \times S_2\times \dots\times S_n
  • 获利/支付函数:评价某一局势下参与者的获利Hi(s),s=(s1,s2,,sn)H_i(s),s = (s_1,s_2,\dots ,s_n)

2)决策问题的分类:

  • 局中人个数:二人对策、多人对策
  • 获利函数代数和:零和对策、非零和对策
  • 局中人策略集是否有限:有限对策、无限对策
  • 是否合作:合作对策、非合作对策

C2 矩阵对策

1)矩阵对策二人 有限 零和 对策

  • 记法约定:局中人Ⅰ Ⅱ,策略集S1={α1,α2,,αm},S2={β1,β2,βn}S_1 = \{\alpha_1,\alpha_2,\dots,\alpha_m\},S_2 = \{\beta_1 ,\beta_2 ,\dots \beta_n\},获利矩阵A=(aij)m×n,aij=H(si,sj),B=ATA = (a_{ij})_{m\times n},a_{ij} = H(s_i,s_j),B= - A^T。对策:G={,;S1,S2,A}G = \{Ⅰ,Ⅱ;S_1,S_2,A\}

2)平衡局势aij:maximinjaij=aij=minjmaxiaij\exist a_{i^*j^*} :\max \limits_{i} \min \limits_{j} {a_{ij}} = a_{i^*j^*} = \min\limits_{j}\max\limits_{i} {a_{ij}}

  • VG=aijV_G = a_{i^*j^*}矩阵对策G的值,对应的αi,βj\alpha_{i^*},\beta_{j^*}最优纯策略

  • 平衡局势存在的充要条件:aij:i,j,aijaijaij\exist a_{i^*j^*}:\forall i,j,a_{ij^*}\le a_{i^*j^*}\le a_{i^*j}(行中最小列中最大),即存在鞍点

  • 鞍点性质:

    • 无差别性:两鞍点的获利取值相同
    • 可交换性:若ai1j1,ai2j2a_{i_1j_1},a_{i_2j_2}是鞍点,则ai1j2,ai2j1a_{i_1j_2},a_{i_2j_1}也是鞍点

3)混合策略:允许策略为策略集集上一个概率分布。

  • 策略集:S={xEmxi0,i=1,2,,m,i=1m=1}S^* = \{x\in E^m |x_i\ge0,i=1,2,\dots,m,\sum_{i=1}^m = 1\}
  • 获利函数:E(x,y)=xTA y=ijaijxiyjE(x,y) = x^TA \ y = \sum\limits_{i}\sum\limits_j a_{ij}x_iy_j
  • 显然,纯策略是xi{0,1}x_i \in\{0,1\}的特例
  • 平衡局势:maxxS1minyS2E(x,y)=minyS2maxxS1E(x,y)    x,y:x,y,E(x,y)E(x,y)E(x,y)\max\limits_{x\in S_1^*}\min\limits_{y\in S_2^*} {E(x,y)} = \min\limits_{y\in S_2^*}\max\limits_{x\in S_1^*}{E(x,y)} \iff \exist x^*,y^*:\forall x,y,E(x,y^*)\le E(x^*,y^*) \le E(x^*,y)
  • 注意到maxxS1minyS2E(x,y)minyS2maxxS1E(x,y)\max\limits_{x\in S_1^*}\min\limits_{y\in S_2^*} {E(x,y)} \le \min\limits_{y\in S_2^*}\max\limits_{x\in S_1^*}{E(x,y)},即Ⅰ的有把握最大获利不会大于Ⅱ的有把握最低损失

4)矩阵对策基本定理:矩阵对策总是存在最优混合策略

  • 记Ⅰ采取纯策略αi\alpha_i时,相应的赢得函数为E(i,y)=jaijyjE(i,y) = \sum\limits_ja_{ij}y_j

    记Ⅱ采取纯策略βi\beta_i时,相应的赢得函数为E(y,j)=iaijxiE(y,j) = \sum\limits_ia_{ij}x_i

    则有E(x,y)=iE(i,y)xi=jE(x,j)yjE(x,y)=\sum\limits_iE(i,y)x_i=\sum\limits_jE(x,j)y_j

  • 平衡局势存在的其它充要条件:

    • x,y:i,j,E(i,y)E(x,y)E(x,j)\exist x^*,y^*:\forall i,j, E(i,y^*)\le E(x^*,y^*)\le E(x^*,j)

    • 以下两个方程组有同解vv
      (){iaijxiv,j=1,2,,nixi=1xi0,i=1,2,,m(){iaijyjv,i=1,2,,mjyj=1yj0,j=1,2,,n (Ⅰ)\begin{cases}\sum\limits_ia_{ij}x_i\ge v,j=1,2,\dots,n \\ \sum\limits_ix_i=1 \\ x_i\ge0,i=1,2,\dots,m\end{cases} (Ⅱ)\begin{cases}\sum\limits_ia_{ij}y_j\le v,i=1,2,\dots,m \\ \sum\limits_jy_j=1 \\ y_j\ge0,j=1,2,\dots,n\end{cases}

    • 此时v=VGv = V_G

  • 基本定理的构造性证明:求解以下对偶线性规划问题
       maxw(P){iaijxiw,j=1,2,,nixi=1xi0,i=1,2,,m   minv(D){iaijyjv,i=1,2,,mjyj=1yj0,j=1,2,,n \begin{aligned} & \ \ \ \max w \\(P)&\begin{cases}\sum\limits_ia_{ij}x_i\ge w,j=1,2,\dots,n \\ \sum\limits_ix_i=1 \\ x_i\ge0,i=1,2,\dots,m\end{cases} \\& \ \ \ \min v \\(D)&\begin{cases}\sum\limits_ia_{ij}y_j\le v,i=1,2,\dots,m \\ \sum\limits_jy_j=1 \\ y_j\ge0,j=1,2,\dots,n\end{cases} \end{aligned}

  • 最优混合策略的性质:

    (x,y)(x^*,y^*)为矩阵对策GG的解,v=VGv = V_G,则

    • xi>0    jaijyj=vx_{i^*}\gt0\implies\sum\limits_ja_{ij}y_{j^*}=v

      yj>0    iaijxi=vy_{j^*}\gt0\implies\sum\limits_ia_{ij}x_{i^*}=v

    • jaijyj<v    xi=0\sum\limits_ja_{ij}y_{j^*}\lt v\implies x_{i^*}=0

      iaijxi>v    yj=0\sum\limits_ia_{ij}x_{i^*}\gt v\implies y_{j^*}=0

5)记矩阵对策GG解集T(G)T(G)

  • 设有2个矩阵对策{G1={S1,S2,A1}G2={S1,S2,A2}\begin{cases}G_1 =\{S_1,S_2,A_1\}\\G_2=\{S_1,S_2,A_2\}\end{cases},其中A1=(aij),A2=(aij+L)A_1=(a_{ij}),A_2=(a_{ij}+L)

    则有VG2=VG1+L,T(G1)=T(G2)V_{G_2}=V_{G_1}+L,T(G_1)=T(G_2)

  • 设有2个矩阵对策{G1={S1,S2,A}G2={S1,S2,αA}\begin{cases}G_1 =\{S_1,S_2,A\}\\G_2=\{S_1,S_2,\alpha A\}\end{cases}

    则有VG2=αVG1+L,T(G1)=T(G2)V_{G_2}=\alpha V_{G_1}+L,T(G_1)=T(G_2)

  • AA为斜对称矩阵(A=ATA=-A^T,又称对称对策),则VG=0,T1(G)=T2(G)V_G=0,T_1(G)=T_2(G)T1(G),T2(G)T_1(G),T_2(G)为Ⅰ,Ⅱ最优策略集

6)优超策略j,ai1jai2j\forall j,a_{i_1j}\ge a_{i_2j},称策略αi1\alpha_{i_1}优超αi2\alpha_{i_2}。即无论Ⅱ做出何种决策,策略αi1\alpha_{i_1}总是比αi2\alpha_{i_2}获利更多

  • αi\alpha_i被其余所有策略优超,或被其线性组合优超,去除该策略对应的行,新对策的最优解仍是原对策最优解。

    (注意到,这种表述说明可能导致解集变小,但是VGV_G不会发生变化)

7)解法:

  • 通过优超策略的化简,有时可化为简单的形式

    • 2×22\times2矩阵对策:先寻找鞍点,若无鞍点,解方程组

    (){a11x1+a21x2=va12x1+a22x2=vx1+x2=1,(){a11y1+a12y2=va21y1+a22y2=vy1+y2=1 (Ⅰ)\begin{cases}a_{11}x_1 + a_{21}x_2=v\\a_{12}x_1 + a_{22}x_2=v\\x_1+x_2=1\end{cases} ,(Ⅱ)\begin{cases}a_{11}y_1 + a_{12}y_2=v\\a_{21}y_1 + a_{22}y_2=v\\y_1+y_2=1\end{cases}

    • 2×n2\times n矩阵对策:图解法。做两垂线。0处做垂线标注a1j,j=1,2,,na_{1j},j=1,2,\dots,n,1处做垂线标注a2j,j=1,2,,na_{2j},j=1,2,\dots ,n。连接a1ja2j,j=1,2,,na_{1j}a_{2j},j=1,2,\dots,n,最低交点为所求
    对策论基础【提纲】
  • 线性方程组方法:注意利用最优混合策略的性质化简矩阵
    (){iaijxi=v,j=1,2,,nixi=1xi0,i=1,2,,m(){iaijyj=v,i=1,2,,mjyj=1yj0,j=1,2,,n (Ⅰ)\begin{cases}\sum\limits_ia_{ij}x_i= v,j=1,2,\dots,n \\ \sum\limits_ix_i=1 \\ x_i\ge0,i=1,2,\dots,m\end{cases} (Ⅱ)\begin{cases}\sum\limits_ia_{ij}y_j= v,i=1,2,\dots,m \\ \sum\limits_jy_j=1 \\ y_j\ge0,j=1,2,\dots,n\end{cases}
    若无非负解,需要将部分等式改为不等式,根据共轭定理对偶使一些量为0

  • 线性规划方法:

    • 先查找鞍点

    • 再验证v=0=VGv=0 = V_G是否满足

    • 求解矩阵对策G={S1,S2,1vA}G = \{S_1,S_2,\frac{1}{v}A\},即:
      (){iaijxi=1,j=1,2,,nmaxixixi0,i=1,2,,m(){iaijyj=1,i=1,2,,mminjyjyj0,j=1,2,,n (Ⅰ)\begin{cases}\sum\limits_ia_{ij}x_i'= 1,j=1,2,\dots,n \\ \max{\sum\limits_ix_i'} \\ x_i\ge0,i=1,2,\dots,m\end{cases} (Ⅱ)\begin{cases}\sum\limits_ia_{ij}y_j'= 1,i=1,2,\dots,m \\ \min{\sum\limits_jy_j'} \\ y_j'\ge0,j=1,2,\dots,n\end{cases}
      一般从Ⅱ开始解,可以在开始就找到一个基本可行解

    • 由解集性质得到原对策的解

C3 其它类型对策简介

1)二人无限零和对策:

  • 最优纯策略:maxαS1minβS2H(α,β)=minβS2maxαS1H(α,β)=H(α,β)    α,β:α,β,H(α,β)H(α,β)H(α,β)\max\limits_{\alpha\in S_1}\min\limits_{\beta\in S_2}{H(\alpha,\beta)}=\min\limits_{\beta\in S_2}\max\limits_{\alpha\in S_1}{H(\alpha,\beta)}=H(\alpha^*,\beta^*)\iff\exist\alpha^*,\beta^*: \forall \alpha,\beta,H(\alpha,\beta^*)\le H(\alpha^*,\beta^*)\le H(\alpha^*,\beta)

  • 混合策略:策略为策略集上一个连续型概率分布

    • 获利函数:H(X,y)=S1H(x,y)dFX;H(x,Y)=S2H(x,y)dFY;H(X,Y)=S1S2H(x,y)dFXFYH(X,y)=\int_{S_1}{H(x,y)}\mathrm{d}F_X;H(x,Y)=\int_{S_2}{H(x,y)}\mathrm{d}F_Y;H(X,Y)=\int_{S_1}\int_{S_2}H(x,y)\mathrm{d}F_XF_Y

    • 最优混合策略:

      supXinfYH(X,Y)=infYsupXH(x,y)=VG    X,Y:X,Y,H(X,Y)H(X,Y)H(X,Y)\sup\limits_X\inf\limits_Y{H(X,Y)}=\inf\limits_Y\sup\limits_X{H(x,y)}=V_G\iff \exist X^*,Y^*:\forall X,Y,H(X,Y^*)\le H(X^*,Y^*)\le H(X^*,Y)

  • 连续对策:S1=S2=[0,1],H(x,y)C(S1×S2)S_1 = S_2 =[0,1],H(x,y)\in C(S_1\times S_2)

    • 连续对策一定有最优混合策略

2)多人非合作对策:

  • 局中人:I={1,2,n}I=\{1,2\dots,n\}

  • 局势:s=(s1,s2,,sn)S1×S2××Sns = (s_1,s_2,\dots,s_n)\in S_1\times S_2\times\dots\times S_n,记更换局势分量i(局中人i改变策略)为 ssi0s\lVert s_i^0

  • 获利函数:Hi(s)H_i(s)

  • 纯策略平衡局势:iI,si0Si:Hi(s)Hi(ssi0)\forall i \in I,s_i^0\in S_i:H_i(s)\ge H_i(s\lVert s_i^0),即所有人在该局势下改变策略不会带来更多获利

  • 混合局势:x=(x1,x2,,xn),xix = (x^1,x^2,\dots,x^n),x^i为局中人ii的一个混合策略。Ei(x)E_i(x)为该局势下局中人ii的获利期望,局中人ii改变策略为:xzix\lVert z_i

    混合策略平衡局势:iI,zi,E(xzi)E(xi)\forall i\in I,z_i,E(x\lVert z_i)\le E(x_i)

  • Nash定理:非合作n人对策在混合策略意义下的平衡局势一定存在

    • 特化:二人有限非零和对策(双矩阵对策)x,y:xTAyxTAy,xTByxTBy\forall x,y:x^{*T}Ay^*\ge x^TAy^*,x^{*T}By^*\ge x^{*T}By

3)合作对策:允许形成联盟