统计学中的三大分布——卡方分布,t分布,F分布(1-6)
一、卡方分布(χ2分布)
背景
正太分布是自然界中最常见的一类概率分布,例如测量的误差:人的生理尺寸:身高,体重等都近似服从正态分布。常见的问题是关于这些正态分布随机变量的平方以及平方和的概率分布问题。
例如在统计物理中若气体分子速度是随机向量V = (X,Y,Z)各分量相互独立,且均服从N(0,1,5),则该分子运动动能:
S = 1/2m( +
+
)的分布规律。
要求S的分布,自然首先就要知道S中随机变量 +
+
的概率分布。
对于这种在实际中经常碰到的税基变量平方和问题,我们自然希望对其加以总结,卡方分布就是在类似的实际背景下提出的。
定义
设 ,
,......
相互独立, 都服从标准正态分布N(0,1), 则称统计量
=
+
+......+
所服从的分布为自由度为 n 的χ2分布.
记为
。
自由度:=
+
+......+
中右端包含独立变量的个数。
概率密度
性质
1、卡方分布的可加性
设
,
,并且相互独立,则
+
可推广到多个随机变量的情形
2、卡方分布的数学期望和方差
二、t分布
背景
历史上,正太分布由于广泛的应用背景和良好的性质,层一度被看做是“万能分布”,在这样的背景下,十九世纪初英国一位年轻的酿酒化学及时Cosset.WS,他在酒厂从事实验数据分析工作,对数据误差有着大量感性的认识,我们知道在总体均值和方差已知情况下,样本均值的分布将随样本量增大而接近正态分布。
但是Cosset在实验中遇到的样本容量仅有5到6个,在其中他发现实际数据的分布情况与正态分布有着较大的差异。
于是他怀疑存在一个不属于正态分布的其他分布,通过学习终于得到了新的密度曲线,并在1908 年以“Student”笔名发表了此项结果,后人称此为“t分布”或“学生氏”分布。
定义
假设X服从标准正态分布N(0,1),Y服从
分布,那么
的分布称为自由度为n的t分布,记为
概率密度
显然图形是关于t = 0对称的,当n充分大时,其图形类似于标准正态变量概率密度的图形。
当n足够大时t分布近似于标准正态分布,但当n较小时,t分布于标准正态分布相差很大。
三、F分布
定义
概率密度
性质
参考百度百科