统计学基础——两个样本均值(频率)之差的分布
一、样本均值之差的定义
设是独立的抽自总体
的一个容量为
的样本的均值。
是独立的抽自总体
的一个容量为
的样本的均值。
则具备以下性质:
-
,
表示抽取多次获取样本均值
的数学期望,根据中心极限定理,则
。
当和
足够大的时候,一般要分别大于50,则
的抽样分布不管两样本的总体分布如何(正态或者偏态)均可看似正态分布来处理。其均值和方差求值如上面式子所示。
如果两总体为正态分布,则也为正态分布,其均值和方差求值如上面式子所示。
【补充】
定理:设,
为两个随机变量,其均值
,
,方差
,
均存在,求
或
。
若不相关(,
独立)的话就等于
若相关(,
不独立)的话,就是
证明:设,
,则
。
二、样本频率之差的定义
设分别从具有参数为和参数为
的二项总体中抽取包含
个观测值和
个观测值的独立样本,则两个样本比例差的抽样分布为:
具备以下性质:
当或
不太小,而
足够大,通常
和
均大于或等于5,
的抽样分布近似为正态分布,其均值和方差的公式如上。