数学建模究极算法之主成分分析法

主成分分析法

1.定义:

主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一种降维方法。

2.基本思想和方法:

1.选择适当权重使得数据加权和分散(使方差最大化)
数学建模究极算法之主成分分析法
数学建模究极算法之主成分分析法
2.注意事项:
(1)主成分分析的结果受量纲的影响,由于各变量的单位可能不一样,如果各自改变量纲,结果会不一样;所以实际中可以先把各变量的数据标准化,然后使用协方差矩阵或相关系数矩阵进行分析。
(2)使方差达到最大的主成分分析不用转轴。
(3)主成分的保留。用相关系数矩阵求主成分时,将特征值小于1的主成分予以放弃。
(4)在实际研究中,由于主成分的目的是为了降维,减少变量的个数,故一般选取少量的主成分(不超过5或6个),只要它们能解释变异的70%~80%(称累积贡献率)就行了。

3.特征因子的筛选:

数学建模究极算法之主成分分析法
数学建模究极算法之主成分分析法
数学建模究极算法之主成分分析法