假设一个包里有三个色子,分别是色子A、色子B和色子C,每个色子的六个面上都标有1-4中的某个数字,其中色子A有两面标1、两面标2、一面标3、一面标4;色子B有两面标2、两面标3、一面标1、一面标4;色子C有三面标4、其余三面分别标1、2、3。先从蒙上眼睛从包中抽取一个色子,用随机变量S表示抽取的色子;再投掷这个色子,让人记下正面朝上的数字后放回。

在这个过程中,除了记录者之外,其他人只能得知一共投掷了N次,得到1、2、3、4的次数分别为N1,N2,N3,N4;每次抽出来的色子是哪一个我们并不知道。称S就是一个hidden state(隐状态),我们观察不到每次试验中S的值,但它的值会影响试验的结果,因此通过试验的结果,我们也可以反过来推断S的性质。
对试验结果的分析
我们先分析我们能观察到的结果,假设我们观察到1、2、3、4的概率分别为p1,p2,p3,p4,它们的定义域是一个单纯形
{(p1,p2,p3,p4):p1,p2,p3,p4∈[0,1],p1+p2+p3+p4=1}
投掷N次,得到1、2、3、4的次数分别为N1,N2,N3,N4,这其实是一个多项分布的样本,似然函数为
L(p1,p2,p3,p4)=N1!N2!N3!N4!N!p1N1p2N2p3N3p4N4
根据p1,p2,p3,p4的定义域与这个似然函数计算最大似然估计:
p^i=NNi,i=1,2,3,4
对隐状态的分析
假设S=A,B,C的概率分别为q1,q2,q3,根据全概率公式,
⎣⎢⎢⎡p1p2p3p4⎦⎥⎥⎤=⎣⎢⎢⎡1/61/31/61/61/61/31/31/61/61/61/61/2⎦⎥⎥⎤⎣⎡q1q2q3⎦⎤
q1,q2,q3前面的系数矩阵其实是每个状态下投掷出某个数字的似然矩阵。表面上看这个是一个超定的线性系统,但实际上概率之和为1消耗了一个自由度,所以给定一组估计值,上述线性系统恰好存在唯一解。任选三个方程,带入前面得到的最大似然估计,就可以估计出隐状态的分布。
如果按照贝叶斯统计的思路来分析,就会更直接一点。根据贝叶斯公式,
q1=(1/3)N1(1/3)N2(1/6)N3(1/6)N4+(1/6)N1(1/3)N2(1/3)N3(1/6)N4+(1/6)N1(1/6)N2(1/6)N3(1/2)N4(1/3)N1(1/3)N2(1/6)N3(1/6)N4q2=(1/3)N1(1/3)N2(1/6)N3(1/6)N4+(1/6)N1(1/3)N2(1/3)N3(1/6)N4+(1/6)N1(1/6)N2(1/6)N3(1/2)N4(1/6)N1(1/3)N2(1/3)N3(1/6)N4q3=(1/3)N1(1/3)N2(1/6)N3(1/6)N4+(1/6)N1(1/3)N2(1/3)N3(1/6)N4+(1/6)N1(1/6)N2(1/6)N3(1/2)N4(1/6)N1(1/6)N2(1/6)N3(1/2)N4