统计推断——假设检验——基于秩次的非参数检验

一、配对资料的符号秩和检验

1、参数检验对比非参数检验

1.1、参数检验的定义:

在总体分布类型已知(如正态分布)的条件下,对其未知参数检验。

统计推断——假设检验——基于秩次的非参数检验检验和方差分析,都是基于总体分布为正态分布、总体方差相等的前提下对总体均数进行的检验。

1.2、非参数检验的定义:

若总体分布未知或已知总体分布与检验所要求的条件不符,经数据转换也不能使其满足参数检验的条件,这时需要采用一种不依赖于总体分布形式的检验方法。这种方法不是对参数进行检验,而是检验总体分布位置是否相同,因而称为非参数检验(nonparametric test)。

1.3、非参数检验的适用条件:

1. 总体分布类型不明

2. 总体分布呈偏态分布

3. 数据一端或两端有不确定值的资料

4. 总体方差不齐

5. 有序分类变量资料

2、基于秩次的非参数检验

秩和检验(rank sum test),是一类常用的非参数检验。

秩和检验是首先将数据按从小到大,或等级从弱到强转换成秩后,再求秩和,计算检验统计量——秩和统计量,做出统计推断。

2.1、配对资料的符号秩和检验

例  对11份工业污水测定氟离子浓度(mg/L),每份水样同时采用电极法及分光光度法测定,结果见表。问就总体而言,这两种方法的测定结果有无差别?

统计推断——假设检验——基于秩次的非参数检验

注意:首先需要进行正态性检验(对差值统计推断——假设检验——基于秩次的非参数检验进行正态性检验),这边我们运用到的是Shapiro–Wilk W检验,详细介绍可见《统计推断——正态性检验》。得到统计推断——假设检验——基于秩次的非参数检验=0.4561,统计推断——假设检验——基于秩次的非参数检验=0.0001,则差值统计推断——假设检验——基于秩次的非参数检验不符合正态分布,则不能使用配对统计推断——假设检验——基于秩次的非参数检验检验进行分析。

Wilcoxon符号秩和检验

1. 建立检验假设,确定检验水准

统计推断——假设检验——基于秩次的非参数检验:差值的总体中位数等于0

统计推断——假设检验——基于秩次的非参数检验:差值的总体中位数不等于0

统计推断——假设检验——基于秩次的非参数检验

2. 计算检验统计量统计推断——假设检验——基于秩次的非参数检验

(1) 求差值d

(2) 编秩:依差值的绝对值由小到大编秩 ; 差值为0,不编秩,且总的对子数相应减少;差值的绝对值相等,称为相持(tie),取平均秩。

样本号 氟离子浓度(mg/L) 差值di 差值di的绝对值 秩次-排序号 秩次-平均秩次 秩次-最终(加正负) T+ T-
电极法 分光光度法
1 10.5 8.8 1.7 1.7 4 4.5 4.5 43.5 -11.5
2 21.6 18.8 2.8 2.8 9 9 9    
3 14.9 13.5 1.4 1.4 3 3 3    
4 30.2 27.6 2.6 2.6 8 8 8    
5 8.4 9.1 -0.7 0.7 1 1.5 -1.5    
6 7.7 7 0.7 0.7 2 1.5 1.5    
7 16.4 14.7 1.7 1.7 5 4.5 4.5    
8 19.5 17.2 2.3 2.3 6 6 6    
9 127 155 -28 28 10 10 -10    
10 18.7 16.3 2.4 2.4 7 7 7    
11 9.5 9.5 0 0 - - -    
编秩步骤
1、先求差值di,并且di的绝对值,再升序排序。
2、排除差值di等于0,不参与编秩,总体的对子数也应该相应减少。
3、对差值相等的样本取平均秩次,如样本5和样本6,di的绝对值均为0.7,所以取平均秩次:(1+2)/2=1.5。
4、根据差值di的正负号,赋予秩次正负号。
5、正负秩分别相加求和:T+=43.5,T-=11.5。
   

(3) 分别求正、负秩和:统计推断——假设检验——基于秩次的非参数检验=43.5,统计推断——假设检验——基于秩次的非参数检验=11.5

(4) 确定统计量统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验=43.5或统计推断——假设检验——基于秩次的非参数检验=11.5(统计量取这两个数中的任意一个数均可)

统计推断——假设检验——基于秩次的非参数检验

3. 确定P值,做出推断

(1) 查表法(统计推断——假设检验——基于秩次的非参数检验≤50)

根据统计推断——假设检验——基于秩次的非参数检验(非零对子数)统计推断——假设检验——基于秩次的非参数检验值,查统计推断——假设检验——基于秩次的非参数检验界值

统计推断——假设检验——基于秩次的非参数检验=10(第11份样本统计推断——假设检验——基于秩次的非参数检验,不参与统计),统计推断——假设检验——基于秩次的非参数检验=11.5或统计推断——假设检验——基于秩次的非参数检验=43.5,查表,得双侧统计推断——假设检验——基于秩次的非参数检验>0.10。按照统计推断——假设检验——基于秩次的非参数检验=0.05水准不拒绝统计推断——假设检验——基于秩次的非参数检验,故据此资料尚不能认为两法测定结果有差别。

Wilcoxon配对符号秩和检验的基本思想

在配对样本中,由于随机误差的存在,各对差值的产生不可避免,假定两种处理的效应相同,则差值的总体分布为对称分布,并且差值的总体中位数为0。若此假设成立,样本差值的正秩和与负秩和应相差不大,均接近统计推断——假设检验——基于秩次的非参数检验 (总秩和的一半);当正负秩和相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝统计推断——假设检验——基于秩次的非参数检验

以下是总秩和的计算公式,其中统计推断——假设检验——基于秩次的非参数检验表示非零对子数(即统计推断——假设检验——基于秩次的非参数检验不为0),注意:此处的总秩和表示统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验绝对值之和。

统计推断——假设检验——基于秩次的非参数检验

(2) 正态近似法(统计推断——假设检验——基于秩次的非参数检验>50):作正态近似检验

统计推断——假设检验——基于秩次的非参数检验>50时,统计推断——假设检验——基于秩次的非参数检验统计量服从均数为统计推断——假设检验——基于秩次的非参数检验,标准差为统计推断——假设检验——基于秩次的非参数检验的正态分布。这个时候我们可以用以下公式做正态近似检验,当相持的情况较多的时候,则计算出来的统计推断——假设检验——基于秩次的非参数检验​​​​​​统计量会偏小,需要校正,统计推断——假设检验——基于秩次的非参数检验表示第统计推断——假设检验——基于秩次的非参数检验次相持的个数,如上面,第一次相持为0.7,相持的个数为2,第二次相持为1.7,相持的个数也为2。

统计推断——假设检验——基于秩次的非参数检验

二、两组独立样本比较的秩和检验

推断连续型变量资料或有序变量资料的两个独立样本代表的两个总体分布是否有差别

1、两组连续型变量资料的秩和检验

例 用两种药物杀灭钉螺,采集了14批活钉螺,随机分为两组分别用甲、乙药物,用药后清点钉螺的死亡数,并计算每批钉螺的死亡率(%),结果见表。问两种药物杀死钉螺的效果有无差别?

Wilcoxon秩和检验

统计推断——假设检验——基于秩次的非参数检验

1. 建立检验假设,确定检验水准

统计推断——假设检验——基于秩次的非参数检验:两种药物杀灭钉螺死亡率的总体中位数相等

统计推断——假设检验——基于秩次的非参数检验:两种药物杀灭钉螺死亡率的总体中位数不相等

统计推断——假设检验——基于秩次的非参数检验

2. 计算检验统计量统计推断——假设检验——基于秩次的非参数检验

(1) 编秩:将两组数据混合,由小到大统一编秩;不同组遇到相同数据取平均秩次。

(2) 求各组秩和:以样本例数较小者为统计推断——假设检验——基于秩次的非参数检验,其秩和为统计推断——假设检验——基于秩次的非参数检验

(3) 确定统计量统计推断——假设检验——基于秩次的非参数检验:若统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验,则统计推断——假设检验——基于秩次的非参数检验=统计推断——假设检验——基于秩次的非参数检验;若统计推断——假设检验——基于秩次的非参数检验=统计推断——假设检验——基于秩次的非参数检验,则统计推断——假设检验——基于秩次的非参数检验=统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验=统计推断——假设检验——基于秩次的非参数检验

统计推断——假设检验——基于秩次的非参数检验

3. 确定P值,做出推断

(1) 查表法

统计推断——假设检验——基于秩次的非参数检验≤10,且统计推断——假设检验——基于秩次的非参数检验≤10时,查T界值表。

双侧0.01<统计推断——假设检验——基于秩次的非参数检验<0.02              内大外小

按照统计推断——假设检验——基于秩次的非参数检验=0.05水准,拒绝统计推断——假设检验——基于秩次的非参数检验,可以认为两种药物杀灭钉螺的效果有差别。

Wilcoxon秩和检验的基本思想

假设含量为统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验的两个样本(统计推断——假设检验——基于秩次的非参数检验​​​​​​),来自同一总体或分布相同的两个总体,则统计推断——假设检验——基于秩次的非参数检验样本的秩和统计推断——假设检验——基于秩次的非参数检验与其理论秩和
统计推断——假设检验——基于秩次的非参数检验相差不大,即统计推断——假设检验——基于秩次的非参数检验仅为抽样误差所致。当二者相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝统计推断——假设检验——基于秩次的非参数检验

(2)正态近似法

统计推断——假设检验——基于秩次的非参数检验

2、两组有序分类变量资料的秩和检验

例 某医科大学营养教研室为了解居民体内核黄素营养状况,于某年夏冬两个季节收集成年居民口服5mg核黄素后4小时的负荷尿,测定体内核黄素含量,结果见表,试比较该地居民夏冬两个季节体内核黄素含量有无差别?

统计推断——假设检验——基于秩次的非参数检验

1. 建立检验假设,确定检验水准

统计推断——假设检验——基于秩次的非参数检验:夏冬两个季节居民体内核黄素含量的,总体分布位置相同

统计推断——假设检验——基于秩次的非参数检验:夏冬两个季节居民体内核黄素含量的,总体分布位置不同

统计推断——假设检验——基于秩次的非参数检验

2. 计算检验统计量统计推断——假设检验——基于秩次的非参数检验

(1) 编秩:将两组数据合并,按等级由小到大统一编秩。先计算各等级合计数,并确定各等级秩次范围,求出各等级的平均秩次。

统计推断——假设检验——基于秩次的非参数检验

(2) 求各组秩和:各等级的平均秩次分别乘以各组在各等级的例数,再求和,即得到各组秩和。

统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验

统计推断——假设检验——基于秩次的非参数检验

统计推断——假设检验——基于秩次的非参数检验

(3) 确定统计量统计推断——假设检验——基于秩次的非参数检验值: 统计推断——假设检验——基于秩次的非参数检验

3. 确定P值,做出推断

统计推断——假设检验——基于秩次的非参数检验=40,正态近似法

统计推断——假设检验——基于秩次的非参数检验

统计推断——假设检验——基于秩次的非参数检验<0.001。按照统计推断——假设检验——基于秩次的非参数检验=0.05水准,拒绝统计推断——假设检验——基于秩次的非参数检验,接受统计推断——假设检验——基于秩次的非参数检验,故可认为夏冬两个季节居民体内核黄素含量有差别。

三、多组独立样本比较的秩和检验

1、定量变量多组独立样本的秩和检验

例4 某医院用3种不同方法治疗15例胰腺癌患者,每种方法各治疗5例。治疗后生存月数见表,问这3种方法对胰腺癌患者的疗效有无差别?

统计推断——假设检验——基于秩次的非参数检验

1. 建立检验假设,确定检验水准

统计推断——假设检验——基于秩次的非参数检验:3种方法治疗后患者生存月数的总体中位数相等

统计推断——假设检验——基于秩次的非参数检验:3种方法治疗后患者生存月数的总体中位数不全相等

统计推断——假设检验——基于秩次的非参数检验

2. 计算检验统计量统计推断——假设检验——基于秩次的非参数检验

(1) 编秩 将三组数据合并,其余步骤同两组定量变量资料

(2) 求各组秩和统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验

(3) 确定检验统计量统计推断——假设检验——基于秩次的非参数检验值 :

统计推断——假设检验——基于秩次的非参数检验

统计推断——假设检验——基于秩次的非参数检验

3. 确定统计推断——假设检验——基于秩次的非参数检验值,做出推断

(1) 查统计推断——假设检验——基于秩次的非参数检验界值表

当组数统计推断——假设检验——基于秩次的非参数检验=3,且各组例数统计推断——假设检验——基于秩次的非参数检验时,可查统计推断——假设检验——基于秩次的非参数检验界值表得到统计推断——假设检验——基于秩次的非参数检验值。

统计推断——假设检验——基于秩次的非参数检验<0.05。按照统计推断——假设检验——基于秩次的非参数检验=0.05水准,拒绝统计推断——假设检验——基于秩次的非参数检验,接受统计推断——假设检验——基于秩次的非参数检验,故可认为3种方法治疗后胰腺癌患者的生存月数有差别。

(2) 查统计推断——假设检验——基于秩次的非参数检验界值表

当组数或各组例数超出统计推断——假设检验——基于秩次的非参数检验界值表时,由于统计推断——假设检验——基于秩次的非参数检验成立时统计推断——假设检验——基于秩次的非参数检验值近似地服从统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验分布,此时可由统计推断——假设检验——基于秩次的非参数检验界值表得到统计推断——假设检验——基于秩次的非参数检验值。

2、有序变量多组独立样本的秩和检验

例 某医院用3种方法治疗慢性喉炎,结果见表,问这3种方法的疗效是否有差别?

统计推断——假设检验——基于秩次的非参数检验

1. 建立检验假设,确定检验水准

统计推断——假设检验——基于秩次的非参数检验:3种治疗方法治疗效果的总体分布位置相同

统计推断——假设检验——基于秩次的非参数检验:3种治疗方法治疗效果的总体分布位置不全相同

统计推断——假设检验——基于秩次的非参数检验

2. 计算检验统计量统计推断——假设检验——基于秩次的非参数检验

(1) 编秩 同两组有序分类变量资料

统计推断——假设检验——基于秩次的非参数检验

(2) 求各组秩和:各组各等级的频数与平均秩次的乘积之和。

统计推断——假设检验——基于秩次的非参数检验

统计推断——假设检验——基于秩次的非参数检验

统计推断——假设检验——基于秩次的非参数检验

(3) 确定检验统计量统计推断——假设检验——基于秩次的非参数检验值 :

统计推断——假设检验——基于秩次的非参数检验

3. 确定统计推断——假设检验——基于秩次的非参数检验值,做出推断

统计推断——假设检验——基于秩次的非参数检验=3,各组例数均大于5,可由统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验 界值表,得统计推断——假设检验——基于秩次的非参数检验<0.005。按照统计推断——假设检验——基于秩次的非参数检验=0.05水准,拒绝统计推断——假设检验——基于秩次的非参数检验,接受统计推断——假设检验——基于秩次的非参数检验 ,故可认为3种方法治疗慢性喉炎的效果有差别。

3、多个独立样本间的多重比较

统计推断——假设检验——基于秩次的非参数检验

例 对例5资料做三个样本间的两两比较。

1. 建立检验假设,确定检验水准

统计推断——假设检验——基于秩次的非参数检验:第统计推断——假设检验——基于秩次的非参数检验种与第统计推断——假设检验——基于秩次的非参数检验种方法疗效的总体分布位置相同

统计推断——假设检验——基于秩次的非参数检验:第统计推断——假设检验——基于秩次的非参数检验种与第统计推断——假设检验——基于秩次的非参数检验种方法疗效的总体分布位置不同

统计推断——假设检验——基于秩次的非参数检验

2. 计算检验统计量统计推断——假设检验——基于秩次的非参数检验

(1) 求各组平均秩次统计推断——假设检验——基于秩次的非参数检验

统计推断——假设检验——基于秩次的非参数检验

(2)列出两两比较计算表,求得统计推断——假设检验——基于秩次的非参数检验

统计推断——假设检验——基于秩次的非参数检验

3. 确定统计推断——假设检验——基于秩次的非参数检验值,做出推断

统计推断——假设检验——基于秩次的非参数检验统计推断——假设检验——基于秩次的非参数检验界值表,得统计推断——假设检验——基于秩次的非参数检验值。按照统计推断——假设检验——基于秩次的非参数检验=0.05水准,甲组与乙组、甲组与丙组比较,均拒绝统计推断——假设检验——基于秩次的非参数检验;而乙组与丙组比较不拒绝统计推断——假设检验——基于秩次的非参数检验,故可认为3种方法治疗慢性喉炎疗效的差别主要存在于甲法与其他两法之间,而乙法与丙法间的疗效尚不能认为有差别。