SPSS学习笔记(一)判断是否服从正态分布
目录
二、正态性检验:偏度(Skewness)和峰度(Kurtosis)定量判断,最实用
一、正态性检验:图形定性判断
1、直方图
在样本量比较大时,可根据直方图及对应的正态概率密度曲线的形状大致判断资料是否服从正态分布。
操作:图形-旧对话框-直方图
结果与分析
上图中横坐标为猪崽体重,纵坐标为猪崽频数。可以看出绘制的直方图与对应的正态分布曲线形状大致相同,基本可以判断资料服从正态分布。
2、P-P图和Q-Q图
- P-P图(频率-频率图)反映了实际观测值的累积频率(横坐标)与正态分布的理论累积概率(纵坐标)的符合程度,Q-Q图(分位数-分位数图)反映了实际观测值的分位数(横坐标)与正态分布的理论分位数(纵坐标)的符合程度。
- 两者意义相似,都可以用来考察数据资料是否服从某种分布类型。若检验的分布类型为正态分布,数据点与理论直线(即对角线)基本重合,则基本认为数据服从正态分布。若偏离直线,认为数据可能不服从正态分布。
操作:分析—描述统计—P-P图/Q-Q图
结果与分析
P-P图/Q-Q图中,各点近似围绕着直线,大致能够判断数据呈近似正态分布
具体证明资料是否符合正态分布还要用正态分布指标检验来判定,如峰度、偏度Z-score检验,K-S、S-W检验等。
二、正态性检验:偏度(Skewness)和峰度(Kurtosis)定量判断,最实用
- 当偏度≈0时,可认为分布是对称的,服从正态分布;
- 当偏度>0时,拖尾在右边,峰尖在左边,也称为正偏态;
- 当偏度<0时,拖尾在左边,峰尖在右边,也称为负偏态;
- 当峰度≈0时,可认为分布的峰态合适,服从正态分布(不胖不瘦);
- 当峰度>0时,分布的峰态陡峭(高尖);
- 当峰度<0时,分布的峰态平缓(矮胖);
偏度、峰度同时≈0时,才认为资料服从正态分布
用偏度和峰度进行正态性检验时,可以同时计算其相应的Z评分(Z-score),即:偏度Z-score=偏度值/标准误,峰度Z-score=峰度值/标准误。α=0.05的检验水平下,若Z-score都在±1.96之间,则可认为服从正态分布,若一个不满足则认为不服从正态分布。
操作:分析-描述统计-频率/-描述
结果与分析
在结果输出的Statistics部分,对变量猪崽数进行了基本的统计描述,
同时给出了其分布的偏度值-0.096(标准误0.241),Z-score =-0.096/0.241 =-0.398,峰度值-0.126(标准误0.478),Z-score = -0.126/0.478 = -0.264。
标准误是样本均值(X拔)的标准差。
偏度值和峰度值均≈0,Z-score均在±1.96之间,可认为数据服从正态分布。
三、正态性检验:非参数检验分析法
- 原假设为“样本来自的总体与正态分布无显著性差异,即符合正态分布”,也就是说P>0.05才能说明资料符合正态分布。
- 正态分布的检验方法有两种,一种是Shapiro-Wilk检验,S-W检验适用于小样本资料(SPSS规定样本量≤5000),另一种是Kolmogorov–Smirnov检验,K-S检验适用于大样本资料(SPSS规定样本量>5000)。
- 当样本量较少的时候,检验结果不够敏感,即使数据分布有一定的偏离也不一定能检验出来;而当样本量较大的时候,检验结果又会太过敏感
操作:分析-描述统计-探索
结果及分析
在结果输出的Tests of Normality部分,给出了Shapiro-Wilk检验及Kolmogorov-Smirnov检验的结果,考虑到样本量≤5000,属于小样本资料,Shapiro-Wilk检验的P值为0.147,在α=0.05的检验水准下,P>0.05,不拒绝原假设,可认为资料服从正态分布。