数据分析|参数估计
参数估计 在统计方法中的地位
参数估计 是为了判定总体数据特征性质,而从中抽取部分样本数据,通过样本的参数进而估计总体数据的特征
目录
1.估计量与估计值的概念
2.点估计与区间估计的区别
3.评价估计量优良性的标准
4.点估计:矩估计法
5.区间估计
6.样本容量的确定
一、估计量与估计值的概念
估计量:用于估计总体参数的随机变量(如:样本均值就是总体均值的一个估计量)
估计值:估计量的值
二、点估计与区间估计的区别
点估计:用样本的估计量直接作为总体参数的估计值(不能很好的说明估计出来的值与总体数据值之间的差距情况)
区间估计:在点估计的估计的基础之上,给出总体参数估计一个区间范围,该区间由样本统计量加减抽样误差而得到的
置信水平:重复抽取样本很多次,并每次构造置信区间,其中置信区间包含总体参数真值的次数所占的比值称为置信水平。(常用的置信水平99%,95%,90%)
置信区间:由样本统计量所构造的总体参数的估计区间称为置信区间,统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间
均值的抽样分布:(1-a)%区间包含了u,a%的区间未包含u
三、评价估计量优良性的标准
无偏性:估计量抽样分布的数学期望等于被估计的总体参数
有效性:对一总体参数的两个无偏点估计量,有更小标准差的估计量更有效
一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数
四、点估计法:矩估计法
最简单的矩估计法是用一阶样本原点矩来估计总体的期望而用二阶样本中心矩来估计总体的方差。
五、区间估计
1.总体均值的区间估计
假定条件:总体服从正态分布,且方差(δ²)未知;小样本(n<30)
使用 t分布统计量
总体均值u在1-a置信水平下的置信区间为
2.总体比例的区间估计
假定条件:总体服从二项分布;可以由正态分布来近似
使用正态分布统计量Z
总体比例π在1-a置信水平的置信区间为:
六、样本容量的确定
1.估计总体均值时样本容量的确定
估计总体均值时样本容量n为
样本容量n与总体方差σ²、边际误差E、可靠性系数Z或t之间的关系为与总体方差成正比;与边际误差成反比;与可靠性系数成正比
2.估计总体比例时样本容量的确定
根据比例区间估计公式可得样本容量n为
其中:
E的取值一般小于0.1,π未知时,可取最大值0.5
往期精选
关注公众号,加小编微信即可拉入线上交流群