机器学习|单个正态总体的区间估计,均值、方差的置信区间求法+实际应用| 15mins 入门 |概统学习笔记(二十八)

(一)单个正态总体N(μ,σ2)N(\mu,\sigma^2)的区间估计

  1. 均值μ\mu的置信区间

(1) σ2\sigma^2已知

X1,...,XnX_1,...,X_n是取自N(μ,σ2)N(\mu,\sigma^2)的样本,σ2\sigma^2已知,求参数μ\mu的置信度为1α1-\alpha的置信区间。

(明确问题,是求什么参数的置信区间?置信水平是多少?)

解:选μ\mu的点估计为X\overline XXN(μ,σ2n)\overline X \sim N(\mu,\frac{\sigma^2}{n})

(寻找未知参数的一个良好估计,可用点估计法得到)

U=Xμσ/nN(0,1)U=\frac{\overline X-\mu}{\sigma/\sqrt{n}} \sim N(0,1)

(寻找一个待估参数估计量的函数为枢轴量,要求其分布为已知,有了分布,就可以求出U取值于任意区间的概率)

对于给定的置信水平1α1-\alpha,查正态分布表得uα/2u_{\alpha /2},使得
P{Xμσ/nuα/2}=1α P\{|\frac{\overline X -\mu}{\sigma/\sqrt n}|\leq u_{\alpha/2}\}=1-\alpha
(对于给定的置信水平(大概率),根据U的分布,确定一个区间,使得U取值于该区间的概率为置信水平)

机器学习|单个正态总体的区间估计,均值、方差的置信区间求法+实际应用| 15mins 入门 |概统学习笔记(二十八)

从中解得
P{Xσnuα/2μX+σnuα/2}=1α P\{\overline X-\frac{\sigma}{\sqrt n}u_{\alpha/2}\leq \mu \leq \overline X+ \frac{\sigma}{\sqrt n}u_{\alpha/2}\}=1-\alpha
于是所求μ\mu的置信区间为
[Xσnua/2,X+σnuα/2] [\overline X-\frac{\sigma}{\sqrt n}u_{a/2}, \overline X+\frac{\sigma}{\sqrt n}u_{\alpha/2}]
也可简记为
X±σnuα/2 \overline X \pm \frac{\sigma}{\sqrt n}u_{\alpha/2}
实际应用

一个车间生产滚珠,滚珠的直径服从正态分布,从某天的产品里随机抽出5个滚珠,量得直径如下(单位:mm)。如果已知该天滚珠直径的方差为0.05,试求平均直径的置信区间(α=0.05\alpha=0.05).

滚珠1 滚珠2 滚珠3 滚珠4 滚珠5
14.6 15.1 14.9 15.2 15.1

解:滚珠直径XN(μ,0.05)X\sim N(\mu,0.05)
X=14.6+15.1+14.9+15.2+15.15=14.98μ \overline X=\frac{14.6+15.1+14.9+15.2+15.1}{5}=14.98 \approx \mu
置信度为1α=0.951-\alpha=0.95,所以ua2=u0.025=1.96u_{\frac{a}{2}}=u_{0.025}=1.96

于是要求的置信区间为
[14.981.96×0.055,14.98+1.96×0.055]=[14.8,15.2] [14.98-1.96\times \sqrt{\frac{0.05}{5}},14.98+1.96 \times \sqrt{\frac{0.05}{5}}]=[14.8,15.2]
(2)σ2\sigma^2未知

σ2\sigma^2未知,故不能用前面给出μ\mu的置信区间[Xσnua/2,X+σnua/2][\overline X-\frac{\sigma}{\sqrt n}u_{a/2},\overline X+\frac{\sigma}{\sqrt n}u_{a/2}]

考虑到S2S^2σ2\sigma^2的无偏估计,因此只需将U=Xμσ/nU=\frac{\overline X-\mu}{\sigma/\sqrt n}中的σ\sigma换成S=S2S=\sqrt{S^2},于是有枢轴量(抽样分布定理3)
T=XμS/nt(n1) T =\frac{\overline X-\mu}{S/\sqrt n} \sim t(n-1)
进而得出μ\mu的置信区间为
[XSnta/2(n1),X+Snta/2(n1)] [\overline X-\frac{S}{\sqrt n}t_{a/2}(n-1),\overline X+\frac{S}{\sqrt n}t_{a/2}(n-1)]
实际运用

​ 已知某种木材横纹抗压力的实验值服从正态分布,对10个试件作横纹抗压力试验得数据如下(单位:Mpa)

​ |48.2|49.3|45.7|47.1|51.0|44.6|43.5|41.8|39.4|46.9|

​ 试对该木材的平均横纹抗压力进行区间估计(α=0.05)(\alpha=0.05)

​ 解:总体的方差未知σ2\sigma^2未知,对总体的μ\mu值进行区间估计,应选用随机变量:
T=XμS/nt(n1) T=\frac{\overline X-\mu}{S/\sqrt n}\sim t(n-1)
​ 根据P{Tta/2(n1)}=1α=0.95P\{|T|\leq t_{a/2}(n-1)\}=1-\alpha=0.95

​ 查自由度为10-1=9的t分布表得:
ta/2(n1)=t0.025(9)=2.262 t_{a/2}(n-1)=t_{0.025}(9)=2.262
​ 即P{XμS/n2.262}=0.95P\{|\frac{\overline X-\mu}{S/\sqrt n}|\leq 2.262\}=0.95

​ 于是平均横纹抗压力μ\mu的置信区间为
[XSn×2.262,X+Sn×2.262] [\overline X-\frac{S}{\sqrt n}\times 2.262,\overline X+ \frac{S}{\sqrt n}\times 2.262]
​ 将实验数据代入,得X=45.75S=35.218\overline X=45.75、S=35.218

​ 则平均横纹抗压力的置信区间为[43.23,48.269][43.23, 48.269]

  1. 方差σ2\sigma^2的置信区间

根据实际情况需要,只需要介绍μ\mu未知下的σ2\sigma^2的置信区间。由于σ2\sigma^2的无偏估计为S2S^2,所以一般采用以下函数G(抽样分布定理2)为枢轴量。
G=(n1)S2σ2χ2(n1) G=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
于是
P{χ1a/22(n1)<(n1)S2σ2<χa/22(n1)}=1a P\{\chi^2_{1-a/2}(n-1)<\frac{(n-1)S^2}{\sigma^2}<\chi^2_{a/2}(n-1)\}=1-a

P{(n1)S2χa/22(n1)<σ2<(n1)S2χ1a/22(n1)}=1a P\{\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)}<\sigma^2<\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}\}=1-a
进而得出σ2\sigma^2的置信区间为
[(n1)S2χa/22(n1),(n1)S2χ1a/22(n1)] [\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}]
标准差σ\sigma的置信区间为
[Sn1χa/22(n1),Sn1χ1a/22(n1)] [\frac{S\sqrt{n-1}}{\sqrt{\chi^2_{a/2}(n-1)}},\frac{S\sqrt{n-1}}{\sqrt{\chi^2_{1-a/2}(n-1)}}]
如果μ\mu已知,则选择的枢轴量为
U=Xμσ/nN(0,1) U=\frac{\overline X-\mu}{\sigma/\sqrt n} \sim N(0,1)

实际应用

岩石密度的测量误差服从正态分布,随机抽测12个样品得S=0.2,求σ2\sigma^2的置信区间(a=0.1)

解:以X表示测量误差,XN(μ,σ2)X\sim N(\mu, \sigma^2), 下面用样本的方差S2=0.22=0.04S^2=0.2^2=0.04来估计总体的方差σ2\sigma^2,对σ2\sigma^2作区间估计(a=0.1),选用随机变量
X2=(n1)S2σ2χ2(n1) X^2=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
于是
P{(n1)S2χa/22(n1)<σ2<(n1)S2χ1a/22(n1)}=0.9 P\{\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)}<\sigma^2<\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}\}=0.9
因为
χ0.052(121)=19.675χ0.952(121)=4.575 \chi^2_{0.05}(12-1)=19.675 \\ \chi^2_{0.95}(12-1)=4.575
σ2\sigma^2的置信区间为
[(n1)S2χa/22(n1),(n1)S2χ1a/22(n1)]=[0.02,0.10] [\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}]=[0.02,0.10]