分布类型的检验
分布类型的检验
1 假设检验的基本思想
1.1 假设检验的标准步骤
- 小概率事件(发生概率很小,如P<=0.05)
- 小概率反证法
原理:对于一个小慨率事件而言,其对立面发生的可能性显然要大大高于这一小概率事件,可以认为小概率事件在一次试验中不应当发生。因此可以首先假定需要考察的假设是成立的,然后基于此进行推导,来计算一下在该假设所代表的总体中进行抽样研究得到当前样本(及更极端样本)的概率是多少。 如果结果显示这是一个小概率事件,则意味着如果假设是成立的,则在一次抽样研究中竟然就发生了小慨率事件。显然违反小概率原理,因此可以按照反证法的思路推翻所给出的假设,认为它们实际上是不成立的,这就是小概率反证法原理。 - 标准步骤:
建立假设 > 确立检验水准 > 进行试验 > 选定检验方法 > 确定P值,给出推断结论
1.2 假设检验的两类错误
- 第一类错误:无效假设H0实际上是正确的,但由于抽样误差的原因,或者说恰好发生小概率事件的原因,使得人们错误地拒绝了它,从而犯了"弃真"的错误,统计学上称它为"第一类错误" 。犯第一类错误的概率是人为指定的,就等于检验水准α。
- 第二类错误:无效假设H0实际上是不正确的,但由于抽样误差的原因,检验中得到的P值大于检验水准,使得人们未能拒绝H0,从而犯了"存伪"的错误,统叶学中称它为"第二类错误",用宇母β表示。和第一类错误不同,犯第二类错误的概率大小在进行假设检验时一般井不知道,但可以根据相关信息进行估计。
2 正态分布检验
2.1 K-S 检验的原理
2.2 案例
3 二项分布检验
3.1 二项分布检验的原理
二项分布是对二分类变量的拟合优度检验,用于考察每个类别中观察值的频数与特定二项分布下的预期频数间是否存在统计学差异。其检验原理实际上和K-S检验的原理相同,只是这里使用的是二分变量,是一个离散分布的检验情况。
3.2 案例
4 游程检验
4.1 游程检验原理
游程检验是对二分变量的随机检验,它可用于判断观察值的顺序是否为随机的。对于两分类变量,连续数个相同取值的记录称为一个游程,比如下面这个序列
0 0 1 1 0 1 1 1 0 0 0 1 00 1 0 0 0 1 0
它有6个0的游程,其长度为1、2、3的各有2个,并有5个1的游程,其中3个长度为1,1个长度为2,1个长度为3。上面的序列总共有 11 个游程。如用U表示序列总的游程数 ,那么对于上面的序列来讲, U= 11。
根据游程检验的假设,如果序列是真随机序列,那么游程的总数应当不太多也不太少,比较适中。如果游程的总数极少,就意味着样本由于缺乏独立性,内部存在着一定的趋势或结构,这可能是由于观察值间不独立( 如传染病的发病) ,或者是来自不同总体;若样本中存在大量的游程,则可能存在系统的短周期波动影响着观察结果,同样不能认为序列是随机的。
SPSS的Runs过程提供了基于游程个数的检验方法,对于连续性变量,该过程首先要将变量值进行分类,然后进行检验。
4.2 案例
5 蒙特卡罗方法
5.1 蒙特卡罗方法原理
蒙特卡罗方法又称为统计模拟法、随机抽样技术,其名称听起来很神奇,但实际上原理非常简单。就是使用随机数(或更常见的伪随机数)来解决很多计算问题的方法,用下面这个例于就可以解释清楚:假设要计算一个不规则图形的面积,图形的不规则程度和计算方法(比如是否使用积分)的复杂程度是成正比的。要使用蒙特卡罗方法解决这个问题,可以假设有一袋豆于,把豆子均匀地朝这个图形撒,然后数这个图形之中有多少颗豆子,这里要假定豆子都在一个平面上,相互之间没有重叠,那么最终图形内豆子的数目就是图形的面积。当豆子越小,撒的量越多时,结果就越精确。