笔记-彻底理解样本方差为何除以n-1
对,https://blog.****.net/Hearthougan/article/details/77859173,的划重点,以及解读:
原文非常优秀,以下内容是我的重新理解,包含大量原文直接摘过来的内容。
无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值。
首先定义总体样本是N(通常是不可全部获得的,比如全世界人口的身高值)。抽样样本是x1,x2...xi。
设样本均值为,样本方差为
,总体均值为
,总体方差为
,那么样本方差
有如下公式:
为什么除n-1,而不是n。为什么n-1是无偏估计。
答:因为样本方差等价于,总体方差乘(1-1/n)。减去的部分(σ^2*1/n),实质上是抽样过程方差,也就是每次的抽样的样本均值,与总体均值μ的方差。
过程:变换求解样本方差的过程,得到,样本方差(S^2)=总体方差(σ^2)-抽样均值的方差(σ^2*1/n)
推导结果:
步骤一:
步骤二:
为什么var(X拔)=σ^2*1/n 。设X为随机变量,X1,X2,...Xi,...,Xn为其n个样本,DX为方差。 根据方差的性质,有D(X+Y)=DX+DY,以及D(kX)=k^2*DX,其中X和Y相互独立,k为常数。 于是D(ΣXi/n)=ΣD(Xi)/(n^2)=DX/n