主成分得分和因子得分

记录一下主成分得分和因子得分

本文是基于各全国各省经济发展情况综合评价
首先贴上总得方差解释
主成分得分和因子得分

A.成分矩阵
主成分得分和因子得分
特别注意:
该成分矩阵(因子载荷矩阵)并不是主成分的特征向量,即不是主成分的系数。主成分系数的求法:各自因子载荷向量除以各自因子特征值的算数平方根。则第一主成分的各个系数是向量(0.885,0.607,0.912,0.465,-0.5
08,-0.619,0.823)除以√3.755后才得到的,(这里是数理统计的相关知识)即(.456,.313,.470,.239,.250,-.262,-.319,.424)才是主成分1的特征向量,满足条件是系数的平方和等于1,分别乘以原始变量标准化之后的变量即为第一主成分的函数表达式;
Y=0.456Z1+0.313Z2+0.470Z3+0.239Z4+0.250Z5-0.262Z6-0.319Z7+
0.424
Z8 ——这里的Z为标准化后的变量

B.成分得分系数矩阵
主成分得分和因子得分

该矩阵是因子载荷矩阵除以各自的方差(即特征值)得来的,实际上是因子分析中各个因子的系数,在主成分分析中不考虑它。

C.因子得分
SPSS中,因子分析的“得分”对话框,选中了“保存为变量”,方法为回归;又选中了“显示因子得分系数矩阵”,因此SPSS的输出结果和原始数据一起显示在数据窗口里:
主成分得分和因子得分
D.主成分得分
特别提醒:
后两列的数据是因子1、因子2和因子3的得分,不是主成分1、主成分2主成分3的得分。主成分得分是相应的因子得分乘相应的方差(即特征值)
即:主成分1得分=因子1得分√3.755
主成分2得分=因子2得分
√3.755
主成分3得分=因子3得分*√3.755
得到各地区的主成分1、主成分2和主成分3的得分表如下
主成分得分和因子得分
(有兴趣的童鞋可以验证一下:上面推导出来的主成分的函数关系与计算出来的主成分得分是否与该数据栏的得分一致)(按道理应该是一致的。。。)
在这里我就帮小伙伴们验证一下,这是通过上述主成分得特征向量函数关系得到得主成分123得得分:
主成分得分和因子得分

通过上述两种操作可以求得主成分1、主成分2和主成分3,
通过主成分得分可以聚类分析和综合评价。
E.综合得分及排序
每个地区的综合得分是按照下列公式计算的:
主成分得分和因子得分
这里得权重w1,w2,w3有两种计算方法,一是通过特征根,二是通过旋转之前方差贡献率,这里要注意对权重归一化处理。
权重公式如下:主成分得分和因子得分
λ是方差贡献率
在案例中具体得计算如下:
主成分得分和因子得分
F.因子分析
参照这篇文章得解释:主成分分析与因子分析及SPSS实现

这里简单记录一下:
因子分析得重点是:探讨变量内在联系和结构(structure detection)
观测变量之间的存在相互依赖关系
在SPSS中进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,以寻求最佳解释方式。
在主界面中点击“旋转”按钮,打开对话框,“方法”=>“最大方差法”,“输出”=>“旋转解”。
主成分得分和因子得分
这是选择后的成分矩阵。经过旋转,可以看出:
公因子1得分越高,所有的跑步和跨栏成绩越差,而跳远、撑杆跳等需要助跑类项目的成绩也越差,所以公因子1代表的是奔跑能力的反向指标,可称为“奔跑能力”。
公因子2与铁饼和铅球的正相关性很高,与标枪、撑杆跳等需要上肢力量的项目也正相关,所以该因子可以成为“上肢力量”。
经过旋转,可以看出公因子有了更合理的解释。
主成分得分和因子得分
由上图,我们可以写出公因子的表达式(用F1、F2代表两个公因子,Z1~Z10分别代表原始变量):

F1 = -0.16Z1+0.161Z2+0.145Z3+0.199Z4-0.131Z5-0.167Z6+0.137Z7+0.174Z8+0.131Z9-0.037Z10
F2同理,略去。
注意,这里的变量Z1~Z10,F1、F2不再是原始变量,而是标准正态变换后的变量。
同样我们可以选择“保存为变量”,方法采用默认的“回归”方法,同时选中“显示因子得分系数矩阵”,来直接得到因子得分。进而后续得聚类分析和综合评价。