AMOS分析技术:测量模型分析;聊聊验证性因子分析(CFA)与探索性因子分析(EFA)的异同点
基础准备
草堂君在前面已经推送了很多篇关于AMOS软件的学习文章,这些文章都已经根据难易程度和学习顺序排好序,并制成了AMOS分析技术导航页,大家可以点击下方文章链接阅读,后面发布的文章也将及时更新进导航页中,需要获取最新导航页的朋友,请前往“SPSS生活统计学”的首页下方导航栏获取。
今天草堂君要介绍的是AMOS软件如何进行测量模型的分析。在解释测量模型之前,我们先来回顾探索性因子分析和验证性因子分析。
探索性与验证性因子分析
前面介绍过,结构方程模型可以分成两部分:测量模型和结构模型。关于测量模型和结构模型的具体解释和描述可以点击后面的文章链接回顾:数据分析技术:结构方程模型;想要“追求”,了解是第一步。
测量模型运用的分析方法其实就是因子分析,跟着草堂君一路学习过来的朋友应该知道,SPSS软件中有因子分析的菜单,关于因子分析的原理,草堂君也在介绍SPSS因子分析功能时详细介绍过,大家可以从SPSS导航页中找到因子分析的文章回顾:SPSS分析技术:因子分析;聊聊因子分析在股票评价(选股)上的应用。那么,SPSS中的因子分析与AMOS中的因子分析有什么异同点呢?
很多上过问卷分析课程的朋友应该知道,因子分析有两种:探索性因子分析和验证性因子分析。探索性因子分析的英文缩写为EFA(Exploratory Factor Analysis),验证性因子分析的英文缩写为CFA(confirmatory factor analysis)。SPSS只能进行探索性因子分析,而AMOS软件做的是验证性因子分析,这两者有什么区别呢?
我们举例说明:假设现在要设计一份量表型的调查问卷,根据调研文献和前期访谈,总共设计3个潜在变量,然后为每个潜在变量设计4~8个题项组成初始问卷。初始问卷的这些题项并不是一定能够与设计的潜在变量对应(没有结构效度),因此可以通过探索性因子分析进行题项的筛选,看看当初设计时应该归于一个因子的题项(聚集在一起表示这些题项相关,可以被同一个潜在变量解释)是否落在同一个因子中,如果没有,那么就需要对相应的题项进行删除或修改处理。验证性因子分析通过AMOS将潜在变量与对应题项绘制测量模型,然后通过数据拟合,看看模型的拟合质量如何,如果模型拟合质量好,说明测量模型绘制的潜在变量与题项的关系通过数据验证。
总结一下,探索性因子分析是假设测量变量(量表题项)能够最终形成几个因子(潜在变量)是未知的,希望通过因子分析,看看量表题项能够形成几个因子,以及每个因子对应哪些题项。验证性因子分析则不同,分析者先根据实际的研究调查情况,将潜在变量与潜在变量对于的题项关系固定,然后用数据来拟合验证这种关系模型是否成立,如果拟合质量好,说明模型关系得到验证,反之则需要进行题项删除或修改。
由此可见,探索性因子分析着重在探索模型结构,而验证性因子分析着重在验证模型结构,因此探索性因子分析常用在问卷的设计初期,帮助分析者建立模型框架,而验证性因子常用在成熟问卷的信效度分析中。
测量模型
测量模型与探索性因子分析的关系:测量模型分析运用的分析方法是探索性因子分析。先画好测量模型中潜在变量与测量变量(题项)的模型图,然后再验证模型质量(拟合质量)。根据测量模型包含的潜在变量个数,可以分为单因子测量模型、两因子测量模型和多因子测量模型,如下图所示,左图是单因子测量模型,右图为三因子测量模型。
从上面AMOS软件绘制的测量模型图中,可以发现,残差项(e1,e2,e3,……)的回归系数都为1,而潜在变量(FAC)与题项间的回归系数,必然有一个回归系数是1,否则模型无法拟合成功。我们以FAC_1的单因子测量模型为例进行说明,该测量模型可以写成下面三个回归模型:
从上面的三个回归模型可知,残差的回归系数都为1,因为残差表示题项(Q1,Q2,Q3)数据在被潜在变量FAC_1解释后剩下的信息,所以权重都相同(设定为1)。回归系数(a1,a2和a3)要求至少有1个设定为1,这是因为测量模型分析的目的是通过三个回归模型方程倒推出潜在变量FAC_1,这与传统意义的自变量预测因变量不同,如果不实现确定一个回归系数为1,那么FAC_1的结果就不是唯一的,因此测量模型无法拟合成功。
下面我们以单因子测量模型为例,介绍如何使用AMOS进行测量模型分析。后面的文章还会涉及到多个因子的测量模型分析,也就是大家通常说的验证性因子分析。
案例分析
现在有包含六个题项的父母心理支持量表,这六个题目包括了父母心理支持的六个方面,题项总得分越高,表示父母支持程度越高,反之,则表示父母支持越低。量表题项如下:
发放问卷后,收回200份有效问卷,将问卷数据整理成SPSS数据文件,如下图所示,左图是数据视图,右图为变量视图。
在AMOS软件中,绘制量表问卷的测量模型,绘制的结果如下图所示。需要注意,残差的回归系数都要设置为1;父母心理支持到六个题项的六个回归系数中,必须有一个回归系数被设置为1。
(以上数据文件及模型文件都已经上传到QQ群:134373751)
分析步骤
1、绘制路径图和数据导入的过程,可以回顾前面的文章:AMOS分析技术:软件安装及菜单功能介绍;这次是****;AMOS分析原理:结构方程模型无法收敛的原因,草堂君在这里就不费过多笔墨介绍了。
2、输出结果的选择。因为测量模型分析实际上进行的是验证性因子分析,所以选择下面的输出结果。
3、完成以上步骤后,点击【计算估计】按钮,输出结果。
结果解释
1、模型的整体拟合情况。作图的心理支持向量前面的XX符号变为OK,表示模型参数拟合成功。左图的模型注释和右图的模型拟合综合结果都显示,模型的卡方值为30.317,显著性为0.000,小于0.05,说明该测量模型的变量关系矩阵与实际数据的关系矩阵存在显著性差异,模型有待改进。
数值21表示样本数据中含有的变量协方差数为21个,计算公式为1/2*6*(6+1)=21,6表示模型中拥有6个测量变量(题项)。待估计的模型参数有12个,包括6个残差方差、1个潜在变量残差和5个回归系数(有1个设定为1)。*度等于21-12=9个,说明模型是可以拟合参数的。
2、模型质量指标。因为模型质量指标很多(各种指标含义的解释,可以回顾文章:AMOS分析技术:模型整体拟合度指标),草堂君在这里只截取其中两个指标表格:CMIN和RMR,GFI。可以知道卡方值为30.317,p值为0.000,小于0.05,说明模型与实际数据间存在显著性差异;同时GFI和AGFI都超过或接近于0.9,说明模型的拟合质量还不错,可以进行修正。
需要注意,用模型卡方值来决定模型的拟合质量是否能够接受是非常敏感的,因为卡方值受测量变量的数量影响非常大,所以很多专家选择用CMIN/DF作为模型质量是否能够接受的标准,一般CMIN/DF在2到3之间,模型拟合质量是良好可以接受的。
3、模型修正。下面是测量模型的修正指标情况,可以发现,残差e5和e6间存在相关,如果在e5和e6间建立双向相关,模型卡方值预计将会降低14.836。结合Q5和Q6的题项,都是关于父母关心孩子学习程度的描述,所以e5和e6间建立相关是符合实际情况的。
4、模型修正。草堂君在这里采用单个文件多个模型的设置方式,如下图所示,在模型框内,设置了父母心理支持和模型修正两个模型,具体的设置过程可以回顾文章:AMOS分析技术:模型修正&单文件多模型操作。在父母心理支持模型(原始模型)中,e5和e6间是不存在相关的,Cov_1需要设置成0;而模型修正的Cov_1为待估计参数,不需要设置。
5、两个模型结果对比。可以发现,通过在e5和e6间建立相关,修正模型的卡方值由原来的30.317降低为13.636,显著性等于0.092,大于0.05,测量模型与实际数据的差异达到不显著水平,模型拟合质量提高。
总结一下
本篇文章介绍了测量模型的概念和使用的分析方法,还介绍了探索性因子分析和验证性因子分析的区别。下篇文章将探索性因子分析的内容,也就是含有多个因子的测量模型分析的内容。通过验证性因子分析,我们可以得到问卷的信效度情况。
案例数据已经上传到QQ群中,需要的朋友可以前往下载。AMOS软件安装包也已经同步分享到QQ群中。
温馨提示:
数据分析课程私人定制,一对一辅导,添加微信(possitive2)咨询!
生活统计学QQ群:134373751,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。
生活统计学微信交流群,用于各自行业的数据研究项目及其成果交流分享;由于人数大于100人,请添加微信possitive2,拉您入群。
数据分析咨询,请点击首页下方“互动咨询”板块,获取咨询流程!