UA MATH566 一个例子:什么是隐状态

UA MATH566 一个例子:什么是隐状态

假设一个包里有三个色子,分别是色子A、色子B和色子C,每个色子的六个面上都标有1-4中的某个数字,其中色子A有两面标1、两面标2、一面标3、一面标4;色子B有两面标2、两面标3、一面标1、一面标4;色子C有三面标4、其余三面分别标1、2、3。先从蒙上眼睛从包中抽取一个色子,用随机变量S表示抽取的色子;再投掷这个色子,让人记下正面朝上的数字后放回。

UA MATH566 一个例子:什么是隐状态

在这个过程中,除了记录者之外,其他人只能得知一共投掷了NN次,得到1、2、3、4的次数分别为N1,N2,N3,N4N_1,N_2,N_3,N_4;每次抽出来的色子是哪一个我们并不知道。称SS就是一个hidden state(隐状态),我们观察不到每次试验中SS的值,但它的值会影响试验的结果,因此通过试验的结果,我们也可以反过来推断SS的性质。

对试验结果的分析

我们先分析我们能观察到的结果,假设我们观察到1、2、3、4的概率分别为p1,p2,p3,p4p_1,p_2,p_3,p_4,它们的定义域是一个单纯形
{(p1,p2,p3,p4):p1,p2,p3,p4[0,1],p1+p2+p3+p4=1}\{(p_1,p_2,p_3,p_4):p_1,p_2,p_3,p_4 \in [0,1],p_1+p_2+p_3+p_4 = 1\}

投掷NN次,得到1、2、3、4的次数分别为N1,N2,N3,N4N_1,N_2,N_3,N_4,这其实是一个多项分布的样本,似然函数为
L(p1,p2,p3,p4)=N!N1!N2!N3!N4!p1N1p2N2p3N3p4N4L(p_1,p_2,p_3,p_4) = \frac{N!}{N_1!N_2!N_3!N_4!} p_1^{N_1}p_2^{N_2}p_3^{N_3}p_4^{N_4}

根据p1,p2,p3,p4p_1,p_2,p_3,p_4的定义域与这个似然函数计算最大似然估计:
p^i=NiN,i=1,2,3,4\hat{p}_i = \frac{N_i}{N},i=1,2,3,4

对隐状态的分析

假设S=A,B,CS=A,B,C的概率分别为q1,q2,q3q_1,q_2,q_3,根据全概率公式,
[p1p2p3p4]=[1/61/61/61/31/31/61/61/31/61/61/61/2][q1q2q3]\left[ \begin{matrix} p_1 \\ p_2 \\ p_3 \\ p_4\end{matrix}\right] = \left[ \begin{matrix} 1/6 & 1/6 & 1/6 \\ 1/3 & 1/3 & 1/6 \\ 1/6 & 1/3 & 1/6 \\ 1/6 & 1/6 & 1/2 \end{matrix}\right] \left[ \begin{matrix} q_1 \\ q_2 \\ q_3 \end{matrix}\right]

q1,q2,q3q_1,q_2,q_3前面的系数矩阵其实是每个状态下投掷出某个数字的似然矩阵。表面上看这个是一个超定的线性系统,但实际上概率之和为1消耗了一个自由度,所以给定一组估计值,上述线性系统恰好存在唯一解。任选三个方程,带入前面得到的最大似然估计,就可以估计出隐状态的分布。

如果按照贝叶斯统计的思路来分析,就会更直接一点。根据贝叶斯公式,
q1=(1/3)N1(1/3)N2(1/6)N3(1/6)N4(1/3)N1(1/3)N2(1/6)N3(1/6)N4+(1/6)N1(1/3)N2(1/3)N3(1/6)N4+(1/6)N1(1/6)N2(1/6)N3(1/2)N4q2=(1/6)N1(1/3)N2(1/3)N3(1/6)N4(1/3)N1(1/3)N2(1/6)N3(1/6)N4+(1/6)N1(1/3)N2(1/3)N3(1/6)N4+(1/6)N1(1/6)N2(1/6)N3(1/2)N4q3=(1/6)N1(1/6)N2(1/6)N3(1/2)N4(1/3)N1(1/3)N2(1/6)N3(1/6)N4+(1/6)N1(1/3)N2(1/3)N3(1/6)N4+(1/6)N1(1/6)N2(1/6)N3(1/2)N4q_1 = \frac{(1/3)^{N_1}(1/3)^{N_2}(1/6)^{N_3}(1/6)^{N_4}}{(1/3)^{N_1}(1/3)^{N_2}(1/6)^{N_3}(1/6)^{N_4}+(1/6)^{N_1}(1/3)^{N_2}(1/3)^{N_3}(1/6)^{N_4}+(1/6)^{N_1}(1/6)^{N_2}(1/6)^{N_3}(1/2)^{N_4}} \\ q_2 = \frac{(1/6)^{N_1}(1/3)^{N_2}(1/3)^{N_3}(1/6)^{N_4}}{(1/3)^{N_1}(1/3)^{N_2}(1/6)^{N_3}(1/6)^{N_4}+(1/6)^{N_1}(1/3)^{N_2}(1/3)^{N_3}(1/6)^{N_4}+(1/6)^{N_1}(1/6)^{N_2}(1/6)^{N_3}(1/2)^{N_4}} \\ q_3 = \frac{(1/6)^{N_1}(1/6)^{N_2}(1/6)^{N_3}(1/2)^{N_4}}{(1/3)^{N_1}(1/3)^{N_2}(1/6)^{N_3}(1/6)^{N_4}+(1/6)^{N_1}(1/3)^{N_2}(1/3)^{N_3}(1/6)^{N_4}+(1/6)^{N_1}(1/6)^{N_2}(1/6)^{N_3}(1/2)^{N_4}}