您的位置: 首页 > 文章 > 为什么样本方差的分母是 n-1？

为什么样本方差的分母是 n-1？

分类: 文章 • 2023-12-23 17:05:16

先把问题完整的描述下。

如果已知随机变量为什么样本方差的分母是 n-1？的期望为，那么可以如下计算方差：

为什么样本方差的分母是 n-1？

上面的式子需要知道为什么样本方差的分母是 n-1？的具体分布是什么（在现实应用中往往不知道准确分布），计算起来也比较复杂。

所以实践中常常采样之后，用下面这个为什么样本方差的分母是 n-1？来近似：

为什么样本方差的分母是 n-1？

其实现实中，往往连为什么样本方差的分母是 n-1？的期望也不清楚，只知道样本的均值：

为什么样本方差的分母是 n-1？

那么可以这么来计算为什么样本方差的分母是 n-1？：

为什么样本方差的分母是 n-1？

那这里就有两个问题了：

为什么可以用来近似？
为什么使用替代之后，分母是？

我们来仔细分析下细节，就可以弄清楚这两个问题。

1 为什么可以用 为什么样本方差的分母是 n-1？ 来近似？

举个例子，假设为什么样本方差的分母是 n-1？服从这么一个正态分布：

为什么样本方差的分母是 n-1？

即，为什么样本方差的分母是 n-1？，图形如下：

为什么样本方差的分母是 n-1？

当然，现实中往往并不清楚为什么样本方差的分母是 n-1？服从的分布是什么，具体参数又是什么？所以我用虚线来表明我们并不是真正知道的分布：

为什么样本方差的分母是 n-1？

很幸运的，我们知道为什么样本方差的分母是 n-1？，因此对采样，并通过：

为什么样本方差的分母是 n-1？

来估计为什么样本方差的分母是 n-1？。某次采样计算出来的：

为什么样本方差的分母是 n-1？

看起来比为什么样本方差的分母是 n-1？要小。采样具有随机性，我们多采样几次，会围绕上下波动：

为什么样本方差的分母是 n-1？

用为什么样本方差的分母是 n-1？作为的一个估计量，算是可以接受的选择。

很容易算出：

为什么样本方差的分母是 n-1？

因此，根据中心极限定理，为什么样本方差的分母是 n-1？的采样均值会服从的正态分布：

为什么样本方差的分母是 n-1？

这也就是所谓的无偏估计量。从这个分布来看，选择为什么样本方差的分母是 n-1？作为估计量确实可以接受。

2 为什么使用 为什么样本方差的分母是 n-1？替代之后，分母是？

更多的情况，我们不知道为什么样本方差的分母是 n-1？是多少的，只能计算出。不同的采样对应不同的：

为什么样本方差的分母是 n-1？

对于某次采样而言，当为什么样本方差的分母是 n-1？时，下式取得最小值：

为什么样本方差的分母是 n-1？

我们也是比较容易从图像中观察出这一点，只要为什么样本方差的分母是 n-1？偏离，该值就会增大：

为什么样本方差的分母是 n-1？

所以可知：

为什么样本方差的分母是 n-1？

可推出：

为什么样本方差的分母是 n-1？

进而推出：

为什么样本方差的分母是 n-1？

如果用下面这个式子来估计：

为什么样本方差的分母是 n-1？

那么为什么样本方差的分母是 n-1？采样均值会服从一个偏离的正态分布：

为什么样本方差的分母是 n-1？

可见，此分布倾向于低估为什么样本方差的分母是 n-1？。

具体小了多少，我们可以来算下：

为什么样本方差的分母是 n-1？

其中：

为什么样本方差的分母是 n-1？

所以我们接着算下去：

为什么样本方差的分母是 n-1？

其中：

为什么样本方差的分母是 n-1？

所以：

为什么样本方差的分母是 n-1？

也就是说，低估了为什么样本方差的分母是 n-1？，进行一下调整：

为什么样本方差的分母是 n-1？

因此使用下面这个式子进行估计，得到的就是无偏估计：

为什么样本方差的分母是 n-1？

为什么样本方差的分母是 n-1？