主成成分分析法


参考链接:主成分分析在SPSS中的操作应用

【 1. 主成成分分析法简介 】

  • 实际案例
    一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。在进行主成分分析后,竟以97.4%的精度,用三新变量就取代了原17个变量。根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。
  • 主成分分析(Principal Component Analysis,PCA)
    在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。因此需要简化,主成分分析法就是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。
  • 主成分
    由原始指标综合形成的几个新指标。依据主成分所含信息量的大小成为第一主成分,第二主成分等等。
  • 主成分与原始变量之间的关系
    (1)主成分保留了原始变量绝大多数信息。
    (2)主成分的个数大大少于原始变量的数目。
    (3)各个主成分之间互不相关。
    (4)每个主成分都是原始变量的线性组合。
  • 方法理解
    假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,…,Xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2,…, Fk(k≤p),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。
    这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi。
    主成成分分析法

【 2. SPSS求解 】

  • 对沿海 10 个省市经济综合指标进行主成分分析
    主成成分分析法
  • 一、导入数据

主成成分分析法

  • 二、降维:因子分析配置

主成成分分析法
将所需全部数据导入变量
主成成分分析法
设置描述属性
主成成分分析法
设置提取属性
主成成分分析法
设置得分属性
主成成分分析法

点击确定后即可弹出分析结果

主成成分分析法
如,GDP和GDP的相关性为1,自己和自己相关性最强;人均GDP和GDP的相关性为-0.094,说明两者相关性不强;等等;
从上表可知 GDP 与工业增加值, 第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系, 与海关出口总额存在着显著关系。可见许多变量之间直接的相关性比较强, 证明他们存在信息上的重叠。

主成成分分析法
主成成分分析法
可以看出第一个特征GDP占72.205%,前两个特征累计占84.551%;所以提取2个主成分。

主成成分分析法
可知 GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷, 说明第一主成分基本反映了这些指标的信息; 人均 GDP 和农业增加值指标在第二主成分上有较高载荷, 说明第二主成分基本反映了人均GDP 和农业增加值两个指标的信息。所以提取两个主成分是可以基本反映全部指标的信息, 所以决定用两个新变量来代替原来的十个变量。

  • 三、数据处理

1. 查看归一化后的变量值:
目的是消除因子的量纲对结果产生的影响。在之前的因子分析中系统已自动进行了归一化处理,这一步只是让归一化后的数据可视化。

主成成分分析法
主成成分分析法
归一化后的数据:
主成成分分析法

2. 方法一:成分矩阵中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数。

例如:主成成分分析法
主成成分分析法
结果:
主成成分分析法

3. 方法二:直接用SPSS给出的数据

主成成分分析法
主成成分分析法
结果:
主成成分分析法