UA MATH564 概率论 QE练习题 信封问题

UA MATH564 概率论 QE练习题 信封问题

这一篇介绍QE理论中出现了两个信封问题相关的题目:2015年1月的第二题和2015年5月的第一题。信封问题最原始的设定是有nn个信封和nn个信件,把nn个信件随机装入nn个信封中。关于这个问题有个非常重要的结论,用PmP_m表示恰好有mm个信件被放入了正确的信封的概率,则
Pm=1m!j=0nm(1)jj!P_m = \frac{1}{m!}\sum_{j=0}^{n-m} \frac{(-1)^j}{j!}

这个式子的推导也非常容易,根据Waring公式(参考UA MATH564 概率论 计算至少有一个发生的概率:Waring公式
Pm=k=mn(1)kmCkmSkP_m= \sum_{k=m}^n (-1)^{k-m}C_k^mS_k

假设事件AiA_i表示第ii个信件被装在正确的信封中,则记号SkS_k表示
Sk=1i1<i2<<iknP(Ai1Ai2Aik)=Cnk(nk)!n!=1k!S_k = \sum_{1 \le i_1 < i_2 < \cdots < i_k \le n} P(A_{i_1} \cap A_{i_2} \cap \cdots \cap A_{i_k}) = C_n^k \frac{(n-k)!}{n!} = \frac{1}{k!}

这个概率的计算比较简单,从nn个信件中抽kk个,这kk个的位置是确定的,所以基本事件数目等于另外(nk)(n-k)个的全排列,基本事件总数等于nn的全排列。因此
Pm=k=mn(1)kmCkmSk=k=mn(1)kmk!m!(km)!1k!=1m!j=0nm(1)jj!P_m= \sum_{k=m}^n (-1)^{k-m}C_k^mS_k = \sum_{k=m}^n (-1)^{k-m}\frac{k!}{m!(k-m)!}\frac{1}{k!} = \frac{1}{m!}\sum_{j=0}^{n-m} \frac{(-1)^j}{j!}

2015年1月的第二题

UA MATH564 概率论 QE练习题 信封问题
Part a
这一问比较简单,不限制每个袋子容纳的球的数目,则基本事件总数为nnn^n,每个球都不在对应编号的袋子里的基本事件数目为(n1)n(n-1)^n,因此概率为
nn(n1)nnn\frac{n^n - (n-1)^n}{n^n}

Part b
这一问就是典型的信封问题,每个袋子只能容纳一个球,每个球都不在对应编号的袋子里的概率,根据信封问题的公式,就是
P0=j=0n(1)jj!P_0 = \sum_{j=0}^{n} \frac{(-1)^j}{j!}

但!考试的时候是不能这样写的。这里提供两种推导的思路,分别从概率论与组合学的角度入手,概率论方法的核心是用示性函数的期望表示事件的概率,把复杂概率化归为简单概率计算;组合学方法的核心是容斥原理。

概率论方法
引入Bernoulli随机变量XiX_iXi=1X_i = 1表示编号为ii的球被放在对应编号的袋子中,则
P0=E[i=1n(1Xi)]=E[1i=1nXi+(1)m1i1<<imnXi1Xim+(1)nX1Xn]P_0 = E \left[ \prod_{i=1}^n (1-X_i) \right] \\= E \left[ 1- \sum_{i=1}^n X_i + (-1)^{m}\sum_{1 \le i_1 < \cdots < i_m \le n} X_{i_1}\cdots X_{i_m} \cdots +(-1)^n X_1\cdots X_n \right]

假设事件AiA_i表示编号为ii的球被装在对应编号的袋子中
E[Xi1Xim]=P(Ai1Ai2Aim)=(nm)!n!E[X_{i_1}\cdots X_{i_m}] = P(A_{i_1} \cap A_{i_2} \cap \cdots \cap A_{i_m}) = \frac{(n-m)!}{n!}

带入可得
P0=j=0n(1)jj!P_0 = \sum_{j=0}^{n} \frac{(-1)^j}{j!}

组合学方法
沿用上述记号,根据容斥原理,至少有一个球在对应编号的袋子里的基本事件总数为
#i=1nAi=i=1n#Ai+(1)m+11i1<<imn#j=1mAij+(1)n+1#i=1nAi\# \bigcup_{i=1}^n A_i = \sum_{i=1}^n \#A_i +(-1)^{m+1} \sum_{1 \le i_1 < \cdots < i_m \le n}\# \bigcap_{j=1}^m A_{i_j} + (-1)^{n+1}\#\bigcap_{i=1}^n A_{i}

其中
#j=1mAij=(nm)!\# \bigcap_{j=1}^m A_{i_j} = (n-m)!

基本事件总数为n!n!,因此概率为
P0=n!#i=1nAin!=j=0n(1)jj!P_0 = \frac{n! - \# \bigcup_{i=1}^n A_i}{n!} = \sum_{j=0}^{n} \frac{(-1)^j}{j!}

2015年5月的第一题

UA MATH564 概率论 QE练习题 信封问题
这道题其实就是对上一题中概率论方法定义的Bernoulli随机变量的深入讨论。注意到XiBer(1/n)X_i \sim Ber(1/n),因此
E[Xi2]=12×1n+02×n1n=1nE[X_i^2] = 1^2 \times \frac{1}{n} + 0^2 \times \frac{n-1}{n} = \frac{1}{n}

XiXjX_iX_j也服从Bernoulli分布,
P(XiXj=1)=P(Xi=1,Xj=1)=(n2)!n!=1n(n1)E[X1Xj]=1n(n1)P(X_iX_j = 1) = P(X_i = 1,X_j = 1) = \frac{(n-2)!}{n!} = \frac{1}{n(n-1)} \\ E[X_1X_j] = \frac{1}{n(n-1)}

有了这两个结论,剩下两个计算就十分容易了
E[Sn2]=E(i=1nXi)2=i=1nEXi2+21i<jnEXiXj=1+2×Cn21n(n1)=2E[Sn]=i=1nEXi=1Var(Sn)=E[Sn2](E[Sn])2=1E[S_n^2] = E \left( \sum_{i=1}^n X_i \right)^2 = \sum_{i=1}^n EX_i^2 + 2\sum_{1 \le i < j \le n} EX_iX_j = 1 + 2 \times C_n^2 \frac{1}{n(n-1)} = 2 \\ E[S_n] = \sum_{i=1}^n EX_i = 1 \\ Var(S_n) = E[S_n^2] - (E[S_n])^2 = 1