[概率统计]商务与经济统计知识点总结 Part 4
第七章 抽样和抽样分布
这章的主要内容就是简单随机抽样和样本选择方法,还要学习如何利用统计量,比如样本均值和样本比率来估计总体均值和总体比率;此外介绍抽样分布的概念。
抽样
从有限总体的抽样
一般来说,简单随机抽样都是有放回抽样。
从无限总体的抽样
对于无限总体的情形,统计学家建议抽取一个所谓的随机样本。
点估计
为了估计总体参数,计算相应的样本特征——样本统计量。
点估计是统计推断的一种形式,使用样本统计量对总体参数进行推断。
抽样分布
x_bar的概率分布为x_bar的抽样分布。抽样分布的知识和性质使我们能够对样本均值与总体均值的接近程度做一个概率度量。
平均值的数学期望
这个点估计是无偏的。
平均值的标准差
当,用有限总体的公式计算
当,用有上面的公式计算
平均值的抽样分布形式
有两种情形:
- 总体服从正态分布:在许多情况下,有理由假设我们抽取随机样本的总体服从正态分布或近似服从正态分布。当总体服从正态分布时,在任何样本容量下平均值的抽样分布都是正态分布
- 总体不服从正态分布:当我们抽取随机样本的总体不服从正态分布时,中心极限定理能够帮助我们确定平均值的抽样分布的形状。
一般来说,样本容量大于或等于30时,平均值的抽样分布就可以用正态分布近似。当总体是严重偏斜或者出现异常点时,可能需要样本容量达到50.最后,当总体为离散型时,正态近似中所需样本容量一般依赖于总体的比例。
样本比率的抽样分布
样本比率的数学期望
样本比率的标准差
样本比率的抽样分布的形态
点估计的性质
无偏性
有效性
在无偏估计中,有较小标准误差的点估计量比其他点估计量更相对有效。
一致性
粗略的讲,如果随着样本容量的增大,点估计量的值与总体参数越来越接近,则称该点估计量是一致的。换言之,大样本情形比小样本情形更易于得到一个好的点估计。
其他抽样方法
分层随机抽样
分层随机抽样的值依赖于层内个体的同质性,那么该层有较低的方差。
整群抽样
当群的个体不同质时,整群抽样得到的结果最佳。在理想的状态下,每一群是整个总体小范围内的代表。
基本应用是区域抽样,其中群为街区或以其他方式去定义的区域。
系统抽样
方便抽样
是一种非概率抽样,不能用于估计样本的拟合性。
判断抽样