为什么样本方差的分母是 n-1?

先把问题完整的描述下。

如果已知随机变量为什么样本方差的分母是 n-1?的期望为为什么样本方差的分母是 n-1?,那么可以如下计算方差为什么样本方差的分母是 n-1?

为什么样本方差的分母是 n-1?

上面的式子需要知道为什么样本方差的分母是 n-1?的具体分布是什么(在现实应用中往往不知道准确分布),计算起来也比较复杂。

所以实践中常常采样之后,用下面这个为什么样本方差的分母是 n-1?来近似为什么样本方差的分母是 n-1?

为什么样本方差的分母是 n-1?

其实现实中,往往连为什么样本方差的分母是 n-1?的期望为什么样本方差的分母是 n-1?也不清楚,只知道样本的均值:

为什么样本方差的分母是 n-1?

那么可以这么来计算为什么样本方差的分母是 n-1?

为什么样本方差的分母是 n-1?

那这里就有两个问题了:

  • 为什么可以用为什么样本方差的分母是 n-1?来近似为什么样本方差的分母是 n-1?

  • 为什么使用为什么样本方差的分母是 n-1?替代为什么样本方差的分母是 n-1?之后,分母是为什么样本方差的分母是 n-1?

我们来仔细分析下细节,就可以弄清楚这两个问题。


1 为什么可以用为什么样本方差的分母是 n-1?来近似为什么样本方差的分母是 n-1?

举个例子,假设为什么样本方差的分母是 n-1?服从这么一个正态分布:

为什么样本方差的分母是 n-1?

即,为什么样本方差的分母是 n-1?,图形如下:

为什么样本方差的分母是 n-1?

当然,现实中往往并不清楚为什么样本方差的分母是 n-1?服从的分布是什么,具体参数又是什么?所以我用虚线来表明我们并不是真正知道为什么样本方差的分母是 n-1?的分布:

为什么样本方差的分母是 n-1?

很幸运的,我们知道为什么样本方差的分母是 n-1?,因此对为什么样本方差的分母是 n-1?采样,并通过:

为什么样本方差的分母是 n-1?

来估计为什么样本方差的分母是 n-1?。某次采样计算出来的为什么样本方差的分母是 n-1?

为什么样本方差的分母是 n-1?

看起来比为什么样本方差的分母是 n-1?要小。采样具有随机性,我们多采样几次,为什么样本方差的分母是 n-1?会围绕为什么样本方差的分母是 n-1?上下波动:

为什么样本方差的分母是 n-1?

为什么样本方差的分母是 n-1?作为为什么样本方差的分母是 n-1?的一个估计量,算是可以接受的选择。

很容易算出:

为什么样本方差的分母是 n-1?

因此,根据中心极限定理,为什么样本方差的分母是 n-1?的采样均值会服从为什么样本方差的分母是 n-1?的正态分布:

为什么样本方差的分母是 n-1?

这也就是所谓的无偏估计量。从这个分布来看,选择为什么样本方差的分母是 n-1?作为估计量确实可以接受。


2 为什么使用为什么样本方差的分母是 n-1?替代为什么样本方差的分母是 n-1?之后,分母是为什么样本方差的分母是 n-1?

更多的情况,我们不知道为什么样本方差的分母是 n-1?是多少的,只能计算出为什么样本方差的分母是 n-1?。不同的采样对应不同的为什么样本方差的分母是 n-1?

为什么样本方差的分母是 n-1?

对于某次采样而言,当为什么样本方差的分母是 n-1?时,下式取得最小值:

为什么样本方差的分母是 n-1?

我们也是比较容易从图像中观察出这一点,只要为什么样本方差的分母是 n-1?偏离为什么样本方差的分母是 n-1?,该值就会增大:

为什么样本方差的分母是 n-1?

所以可知:

为什么样本方差的分母是 n-1?

可推出:

为什么样本方差的分母是 n-1?

进而推出:

为什么样本方差的分母是 n-1?

如果用下面这个式子来估计:

为什么样本方差的分母是 n-1?

那么为什么样本方差的分母是 n-1?采样均值会服从一个偏离为什么样本方差的分母是 n-1?的正态分布:

为什么样本方差的分母是 n-1?

可见,此分布倾向于低估为什么样本方差的分母是 n-1?

具体小了多少,我们可以来算下:

为什么样本方差的分母是 n-1?

其中:

为什么样本方差的分母是 n-1?

所以我们接着算下去:

为什么样本方差的分母是 n-1?

其中:

为什么样本方差的分母是 n-1?

所以:

为什么样本方差的分母是 n-1?

也就是说,低估了为什么样本方差的分母是 n-1?,进行一下调整:

为什么样本方差的分母是 n-1?

因此使用下面这个式子进行估计,得到的就是无偏估计:

为什么样本方差的分母是 n-1?

为什么样本方差的分母是 n-1?