机器学习|五个重要的抽样分布定理|15mins入门|概统学习笔记(二十一)

重要的抽样分布定理

  • 前提:都是单个总体的样本,样本的数学期望和方差都易求,以此来求总体的数学期望和方差

定理1(样本均值的分布)

  • 定义:设X1,X2,...,XnX_1,X_2,...,X_n是取自正态总体N(μ,σ2)N(\mu,\sigma^2)的样本,则有X\overline X~N(μ,σ2n)N(\mu,\frac{\sigma^2}{n})

    因此Xμσ/n\frac{\overline X - \mu}{\sigma/\sqrt{n}}~N(0,1)N(0,1)

  • 作用:可推测总体的μσ2\mu、\sigma^2值,但前提是至少有一个已知

    证明:

E(X)=E(1ni=1nXi)=1nE(i=1nXi)=1n(i=1nEXi)=1n×n×μ=μ E(\overline X)=E(\frac{1}{n}\sum_{i=1}^nX_i)=\frac{1}{n}E(\sum_{i=1}^nX_i)=\frac{1}{n}(\sum_{i=1}^nEX_i)=\frac{1}{n}\times n \times\mu=\mu

D(X)=D(1ni=1nXi)=1n2D(i=1nXi)=1n2(i=1nDXi)=1n2×n×σ2=σ2n D(\overline X)=D(\frac{1}{n}\sum_{i=1}^nX_i)=\frac{1}{n^2}D(\sum_{i=1}^nX_i)=\frac{1}{n^2}(\sum_{i=1}^nDX_i)=\frac{1}{n^2}\times n\times \sigma^2 = \frac{\sigma^2}{n}

机器学习|五个重要的抽样分布定理|15mins入门|概统学习笔记(二十一)

定理2 (样本方差的分布)

  • 定义:设X1,X2,...,XnX_1,X_2,...,X_n是取自正态总体N(μ,σ2)N(\mu,\sigma^2)的样本,X\overline XS2S^2分别为样本均值和样本方差,则有(n1)S2σ2\frac{(n-1)S^2}{\sigma^2}~χ2(n1)\chi^2(n-1),且X\overline XS2S^2相互独立。

  • 作用:在总体的μ\mu未知时,可推测总体的σ2\sigma^2的值。

机器学习|五个重要的抽样分布定理|15mins入门|概统学习笔记(二十一)

定理3(样本的均值与方差的联合分布)

  • X1,X2,...,XnX_1,X_2,...,X_n是取自正态总体N(μ,σ2)N(\mu,\sigma^2)的样本,X\overline XS2S^2分别为样本均值和样本方差,则有

    XμS/n\frac{\overline X-\mu}{S/\sqrt{n}}~t(n1)t(n-1)

  • 作用:在总体的σ2\sigma^2未知时,可推测总体的μ\mu

  • 证明:

    由定理一可知:Xμσ/n\frac{\overline X-\mu}{\sigma/\sqrt{n}}~N(0,1)N(0,1)

    由定理二可知:(n1)S2σ2\frac{(n-1)S^2}{\sigma^2}~χ2(n1)\chi^2(n-1)

    且两者相互独立,由t分布的定义可知

    Xμσ/n(n1)S2σ2(n1)\frac{\frac{\overline X-\mu}{\sigma/\sqrt n}}{\sqrt{\frac{(n-1)S^2}{\sigma^2(n-1)}}}~t(n1)XμS/nt(n-1) \quad \to \quad \frac{\overline X-\mu}{S/\sqrt{n}}~t(n1)t(n-1)

定理4 (两总体样本均值差的分布)

  • XX$N(\mu,\sigma^2)$,$Y$N(μ2,σ2)N(\mu_2,\sigma^2),且X与Y独立,X1,X2,...,Xn2X_1,X_2,...,X_{n_2}是取自X的样本,Y1,Y2,...,Yn2Y_1,Y_2,...,Y_{n_2}取自Y的样本,X\overline XY\overline Y分别是这两个样本的样本均值,S12S_1^2S22S_2^2分别是这两个样本的样本方差,则有

    XY(μ1μ2)(n1)S12+(n21S22)n1+n221n1+1n2\frac{\overline X-\overline Y-(\mu_1-\mu_2)}{\sqrt{\frac{(n-1)S_1^2+(n_2-1S_2^2)}{n_1+n_2-2}}\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}~t(n1+n22)t(n_1+n_2-2)

定理5 (两总体样本方差比的分布)

  • XX$N(\mu,\sigma^2)$,$Y$N(μ2,σ2)N(\mu_2,\sigma^2),且X与Y独立,X1,X2,...,Xn2X_1,X_2,...,X_{n_2}是取自X的样本,Y1,Y2,...,Yn2Y_1,Y_2,...,Y_{n_2}取自Y的样本,X\overline XY\overline Y分别是这两个样本的样本均值,S12S_1^2S22S_2^2分别是这两个样本的样本方差,则有

    S12/σ12S22/σ22\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}~F(n11,n21)F(n_1-1,n_2-1)

  • 作用:可推测两个总体的方差比值