统计|如何理解区间估计中σ已知和未知的情形
本博文源于《商务统计》,区间估计对于一些初学者来说是非常头痛的事情,公式有多,看有么看不懂,不知道如何去做,去估计置信区间。本博文就以熟悉的例子来理解σ已知和未知的情形。
区间估计起源
总体和样本是两个概念,我们总想让样本的一些特性去估计总体的属性,现实中根据前人已经总结好的定律:大数定律。告诉我们,只要样本足够大就能清晰描述总体的属性。而且样本大一定能服从正态分布。
统计|如何理解样本足够大样本就一定服从正态分布
那么这时候我们可以用样本的一些属性较好的模拟出总体的分布。
区间估计:正态总体,σ^2已知
前面提到样本大就一定服从正态分布,样本大在我们统计学中一般认为n>30即可,即使样本<30,但题目中已经告诉你正态总体的情况下,其实也可以。σ^2就是样本方差…这时候我们用正态分布统计量z来搞定区间估计:
或许根本不需要理解z的具体内容,只需要知道z一般题目中会在这种前提下会告诉你,比如这题:
例子:食品检测标准案例
解决实验步骤
- 求取25袋食品重量的均值
- 然后将题目中的量化为参数带进公式
- 计算公式的值,求取结果。
实验内容解决细节
- 25袋食品质量平均值105.36
- z统计量是95%置信水平区间,因此是1.96
- 标准差σ告诉我们是10
- n就是样品容量是25
区间估计:正态总体、σ^2未知,小样本
当σ^2不知道的时候,σ也就是标准差,标准差的平方就是方差,方差未知,可以根据t分布统计量去模拟,为什么t统计量,因为《统计学》中,有一张t分布表,t分布是正态分布小样本形态,随着样本增大,t分布逐渐逼近正态分布。这时候置信区间公式就变成了:
- t就是服从n-1自由度下的多少置信水平的值
- s就是样本标准差
- n就是样本的数量
- x把 就是样本均值
例子:灯泡寿命置信区间
解决实验步骤
- 计算样本平均值x把
- 计算样本标准差s
- 查出t表,t的自由度是样本大小-1
- 套用公式收获喜悦
实验内容细节
- n=16
- 1-α=95%
- t(α/2)=2.131
- 样本均值x拔为1490
- s标准差为24.77
- 代入公式,求取结果
总结
区间估计是我们根据样本的性值去估计总体的分布一个很好的手段,而一般的形式无非是:点估计±临界值 * 标准误差,然后根据σ已知和未知去分类,如果已知那就是正态分布z统计量,如果未知那就是t分布统计量。