关于PCA的思考
PCA感悟:首先对于样本特征向量我可以认为他是一个通用的程度值;然后默认为ui={0,….,1,…0}的向量空间中;而对于pca降维后y=GTx(G={w1,w2,w3…wp}),我是不是可以这样认为,就是在一个新的向量空间中对于那个通用程度值,他的每个样本之间的方差是最大的,然后我将他具现到当前向量空间中;而方差最大的根本原因,我感觉是把当前向量空间中的测试标准用到了你认为的那个方差最大的向量空间中,感觉类似于这种情况:首先对于向量x={1,2,3,4,5},他有5个维度,那么如果默认就是以基向量ui={0,….,1,…0}为底的向量空间中的一个点,但是我可以用另外一组基向量,使得样本方差最大;
如图(以3维举例):
这分别是两组基向量,但是默认为左边的,不过右边的基向量的样本方差大,所以我们就转化为以右边为主的基向量,就是y=UTx。
就是y=Ix与y=G*x(I是单位矩阵,而G是一个通过基向量构成的矩阵),然后样本的每个个体转化为右边后,它们之间的方差就比左边的大;
而pca进行特征提取,应该就是在G这个向量空间中选了几个方差最大的维度。