SPSS分析基础——T检验
SPSS分析基础——T检验
推断统计是根据样本数据推断总体特征的方法。 参数检验是推断统计的重要组成部分。
总体分布已知情况下为参数检验;总体分布未知的情况下,为非参数检验。
T检验,主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。 T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与f检验、卡方检验并列。
SPSS中t检验有三类可选:
- 单样本t检验:将一个变量的平均值与已知值或假设值进行比较;
- 独立样本t检验(双样本t检验):比较两组个案中一个变量的平均值;
- 配对样本的t检验(相关t检验):比较单个组中两个变量的平均值。
单样本的T检验
以SPSS自带数据范例sample中的brakes.sav为例,进行单样本的T检验分析。
数据介绍(brakes.sav)
该假设数据文件涉及某生产高性能汽车盘式制动器的工厂的质量控制。该数据文件包含对 8 台专用机床中每一台的 16 个盘式制动器的直径测量。盘式制动器的目标直径为 322 毫米。
数据分析
我们需要对各个机器分别进行检验其是否符合标准,因此需要根据机器拆分数据文件。
数据 > 拆分文件 > 比较组
- 比较组,将所有拆分文件的结果包含在同一个表中。
- 按组来组织输出,会按组创建多个透视表。
数据为小样本并且样本服从正态分布,可以采用单样本的T检验分析。
分析 > 比较平均值 > 单样本T检验
设置检验值为322
单样本T检验结果及分析
机器号为2,4,7的机器刹车片直径不符合要求。其t检验显著性低于0.05,差异具有统计学意义,表示其刹车片直径和目标直径为 322 毫米有显著性差异。
独立样本的T检验
两独立样本的T检验,目的是推断两个样本分别代表的总体均数是否相等,一般假设为相等,sig<0.05,即拒绝原假设,两样本有差异。
数据介绍(creditpromo.sav)
使用SPSS自带数据范例sample中的creditpromo.sav。
该假设数据文件涉及某百货公司在评价最新信用卡促销的效果方面的举措。为此,随机选择了 500 位持卡人。其中一半收到了宣传关于在接下来的三个月内降低消费利率的广告。另一半收到了标准的季节性广告。
目的是比较两种促销方式下用户信用卡消费均值,看两者是否在统计上有明显差异。
数据分析
进行探索性分析,通过正态分布检验,检验数据是否服从正态分布。
分析 > 描述统计> 探索
显著性sig >0.05,说明与正态性没有显著差异,成正态分布。
查看Q-Q图进一步确认。
显然,散点能够与斜线重合,说明该数据序列符合正态分布。
若数据点明显分散在直线两侧,则说明数据不成正态分布。
符合t检验适用要求,适合使用双样本t的检验,也就是独立样本t检验。
分析 > 比较平均值 > 独立样本T检验
独立样本T检验结果及分析
从样本均值来看,新促销下,消费者平均消费要高于标准促销71美元。
T检验统计量为-2.26,sig值为0.024<0.05,两者差异显著。超市应该推广新促销模式。