初识假设检验

1. 什么是假设检验 (Hypothesis test)

假设检验是先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。

它采用逻辑上的反证法和依据统计上的小概率原理。小概率思想认为小概率事件在一次实验中基本不可能发生,所以我们假设检验的逻辑是:如果在愿假设正确的前提下,检验统计量的样本观测值出现了小概率事件,我们有理由怀疑愿假设的真实性,从而否定它,转而接受被泽假设。

换句话说

假设检验就分为 假设 和 检验 两步骤,先提出假设,之后验证假设是不合理的。

2. 假设检验的两类错误

第 I 类错误(弃真错误): 零假设为真时错误地拒绝了零假设。犯第 I 类错误的最大概率记为 α(alpha)。
第 II 类错误(取伪错误): 零假设为假时错误地接受了零假设。犯第 II 类错误的最大概率记为 β(beta)。
初识假设检验
在假设检验中,我们可能在决策上犯这两类错误。一般来说,在样本量确定的情况下,任何决策无法同时避免这两类错误的发生,即在减少第一类错误发生的同时,会增大第二类错误发生的几率,或者在减少第二类错误发生的同时,会增大第一类错误发生的几率。要使α和β 都同时减小,除非增加样本的容量。

因此,统计学家奈曼与皮尔逊提出了一个原则:即在控制犯第一类错误的概率????情况下,尽量使犯第二类错误的概率????小。人们通过事先给定显著性水平α的值来控制第一类错误发生的概率,常用的 α 值有 0.01,0.05,0.1。如果犯第一类错误的成本不高,那么可以选择较大的α值;如果犯第一类错误的成本很高,则选择较小的α值。

注:人们将只控制第一类错误的假设检验称为显著性检验,许多假设检验的应用都属于这一类型。

3. 假设检验的基本术语

零假设( null hypothesis ): 试验者想收集证据予以反对的假设,也称为原假设, 通常记为 H0H_0.

被泽假设( alternative hypothesis ): 试验者想收集证据予以支持的假设,通常记为 H1H_1HaH_a.

单尾检验(one-tailed test): 如果备择假设具有特定的方向性,并含有符号 “>” 或 “<” ,这样的检验称为单尾检验。单尾检验分为左尾(lower tail)和右尾(upper tail)。
初识假设检验

当出现关键词 不得少于/低于 的时候用左尾,比如灯泡的使用寿命不得少于/低于700小时
当出现关键词 不得多于/高于 的时候用右侧,比如次品率不得多余/高于5%

双尾检验(two-tailed test): 如果备择假设没有特定的方向性,并含有符号“≠”,这样的检验称为双尾检验。
初识假设检验

显著性水平(level of significance): 当零假设为真时,错误拒绝零假设的临界概率,即犯第一类错误的最大概率,用α表示。
例如:在5%的显著性水平下,样本数据拒绝原假设。我们一般认为 P-value<=0.05 就可以认为假设是不正确的。0.05这个标准就是显著水平,当然选择多少作为显著水平也是主观的。

再举个例子,小明抛硬币猜面,取单侧P值,我们假设小明不能猜出正确的面,如果10次猜对9次:

P-value = P(9<=X<=10) = 0.01 <= 0.05

那么我们刚开始的假设就错的很“显著”。

置信度 (confidence level ): 置信区间包含总体参数的确信程度,即1-α。
例如:95%的置信度表明有95%的确信度相信置信区间包含总体参数(假设进行100次抽样,有95次计算出的置信区间包含总体参数)。

置信区间(confidence interval): 包含总体参数的随机区间。

临界值(critical value): 与检验统计量的具体值进行比较的值。是在概率密度分布图上的分位数。这个分位数在实际计算中比较麻烦,它需要对数据分布的密度函数积分来获得。

临界区域(critical region): 拒绝原假设的检验统计量的取值范围,也称为拒绝域(rejection region),是由一组临界值组成的区域。如果检验统计量在拒绝域内,那么我们拒绝原假设。

检验统计量( test statistic ): 用于假设检验计算的统计量。
例如:Z值、t值、F值、卡方值。
初识假设检验

p值 (p-value): 在零假设为真时所得到的样本观察结果或获得更极端结果的概率。也可以说,p值是当原假设为真时,错误拒绝原假设的实际概率。

左尾检验的P值为检验统计量x小于样本统计值C的概率,即:p = P( x < C)
右尾检验的P值为检验统计量x大于样本统计值C的概率,即:p = P( x > C)
双尾检验的P值为检验统计量x落在样本统计值C为端点的尾部区域内的概率的2倍,即:p = 2P( x > C) (当C位于分布曲线的右端时) 或p = 2P( X< C) (当C 位于分布曲线的左端时) 。
初识假设检验

4. 假设检验的步骤

初识假设检验

5. 具体实例

(1)

某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为μ=0.081mm,总体标准差为σ= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(α=0.05)

由于我们已经知道总体均值和总体方差,根据检测统计量的规则,我们可以直接用 z 统计量

初识假设检验

(2)

某种元件的寿命x(小时),服从正态分布,N(mu,sigma2),其中mu,sigma2均未知,其中抽样的16只元件的寿命如下:
159 280 101 212 224 379 179 264
222 362 168 250 149 260 485 170
问是否有理由认为元件的平均寿命等于250小时?

初识假设检验
这里采用 z 检测 t=Xˉμ0S/35t= \frac{\bar{X} - \mu_0}{S/\sqrt{35}}

Xˉ\bar{X}是随机样本均值,μ0μ0 是总体均值,s 是样本标准差,n 是样本中的观察值数量,自由度为 n-1)

在总体均值的假设值中输入250即可在p值中出现上侧、下侧、双侧的p值。因为双侧检验p值为0.735>0.05,所以不能拒绝原假设(μ0\mu_0=250),拒绝备择假设(μ0\mu_0不等于250),因此认为在0.05的显著性水平下,测量元件寿命与250没有显著性差异,也就是以95%的概率接受元件寿命等于250的结论。

参考资料:
[1] 统计学基础–假设检验

[2] 假设检验

[3] 统计学中的假设检验

[4] #简单统计学#单样本t检验