机器学习笔记(四）PCA主成分分析

首先先复习一下要用到的基础的知识：

（一）、协方差和方差

样本均值：

机器学习笔记(四）PCA主成分分析

样本方差：

机器学习笔记(四）PCA主成分分析

样本X和样本Y的协方差：

机器学习笔记(四）PCA主成分分析

协方差代表了两个变量之间的相关关系，协方差为正时，说明X和Y是正相关关系；协方差为负时，说明X和Y是负相关关系；协方差为0时，说明X和Y是相互独立。Cov(X,X)就是X的方差。当样本是n维数据时，它们的协方差实际上是协方差矩阵(对称方阵)。例如，对于3维数据(x,y,z)，计算它的协方差就是：

机器学习笔记(四）PCA主成分分析

（二）、特征值与特征向量

如果向量v与变换A满足Ax=λx，则称向量x是变换A的一个特征向量，λ是相应的特征值。

描述正方形矩阵的特征值的重要工具是特征多项式，λ是A的特征值等价于线性方程组(A – λI) x = 0 （其中I是单位矩阵）有非零解x (一个特征向量)，因此等价于行列式|A – λI|=0 。

函数p(λ) = det(A – λI)是λ的多项式，因为行列式定义为一些乘积的和，这就是A的特征多项式。矩阵的特征值也就是其特征多项式的零点。一个矩阵A的特征值可以通过求解方程pA(λ) = 0来得到。若A是一个n×n矩阵，则pA为n次多项式，因而A最多有n个特征值,包括虚数。但是如果是是对称矩阵的话他的特征值都是实数。Ax表示对向量x的旋转拉伸。如果Ax和x的方向一样，只是长度不一样，说明x是A的特征向量，拉伸倍数为λ。例如下图，x3是A的特征向量。

机器学习笔记(四）PCA主成分分析

如果机器学习笔记(四）PCA主成分分析有n个线性无关的特征向量，与它们对应的特征值是，以为列向量组作成一个可逆矩阵T，对角矩阵对角元素的分别是，可以得到

机器学习笔记(四）PCA主成分分析

（三）、PCA算法的数学原理。

先看下面这幅图：

机器学习笔记(四）PCA主成分分析

先假定只有二维，即只有两个变量，它们由横坐标和纵坐标所代表；因此每个观测值都有相应于这两个坐标轴的两个坐标值；如果这些数据形成一个椭圆形状的点阵，那么这个椭圆有一个长轴和一个短轴。在短轴方向上，数据变化很少；在极端的情况，短轴如果退化成一点，那只有在长轴的方向才能够解释这些点的变化了；这样，由二维到一维的降维就自然完成了。上图中，u1就是主成分方向，然后在二维空间中取和u1方向正交的方向，就是u2的方向。则n个数据在u1轴的离散程度最大（方差最大），数据在u1上的投影代表了原始数据的绝大部分信息，即使不考虑u2，信息损失也不多。而且，u1、u2不相关。只考虑u1时，二维降为一维。

对给定的一组数据（下面的阐述中，向量一般均指列向量）：

机器学习笔记(四）PCA主成分分析