轻松学统计--中国mooc6
抽样与抽样分布:
•为什么要抽样?
–总体中元素较多时,对所有元素进行逐一观测往往很不现实,费时费力不及时
–要想知道梨子的味道就要亲口尝一尝
–你不必吃完整一头牛,才知道它的肉是咬不动的
–某种抽样有破坏性,如炮弹、灯管等
•样本和总体
•重置抽样和不重置抽样
•概率抽样和非概率抽样
•简单随机抽样(simple random sampling)
–从总体N个单位中随机地抽取n个单位作为样本,使得每一个单位都有相同的机会(概率)被抽中
–优点:
•简单、直观,抽样框完整时,可直接从中抽取样本
•用样本统计量对目标量进行估计比较方便
–缺点:
•N很大时,不易构造抽样框
•抽出的单位很分散,给实施调查增加了困难
•分层随机抽样(Stratified sampling )
–将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。
•整群抽样(Cluster sampling)
–将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。
•系统抽样(Systematic sampling )
–将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。
常见的概率分布:
正态分布:
•在随机理论中,正态分布是最重要的一种分布,理由如下:
•⑴它是最常见的一种分布,现实中许多随机变量都服从或近似服从正态分布。
•⑵在一定的条件下,正态分布是其他分布的近似分布。
•⑶许多有用的分布,特别是小样本的精确分布是由正态分布推导出来的。
X2分布:
t分布:
F分布:
1.样本统计量的概率分布,是一种理论分布
–在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布
2.样本统计量是随机变量
–样本均值, 样本比例,样本方差等
3.结果来自容量相同的所有可能样本
4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据
样本均值的抽样分布:
中心极限定理: