背景
有很多Sparse PCA 算法运用了收缩算法,但是呢,往往只考虑如何解决,每一次迭代的稀疏化问题,而忽略了收缩算法的选择。
##总括

Hotelling’s deflation
公式
At=At−1−xtxtTAt−1xtxtT
特点
如果xt是At−1的特征向量
那么
Atxt=(At−1−xtxtTAt−1xtxtT)xt=0
所以,xt依然是A_t的特征值为0所对应的特征向量。
但是,如果xt不是特征向量,Atxt=0这个性质就不存在了,而且,At不一定是半正定矩阵。

Projection deflation
公式
At=(I−xtxtT)At−1(I−xtxtT)
特点
半正定
假设At−1是半正定的。那么,对于任意的x
xTAtx=[xT(I−xtxtT)]At−1[(I−xtxtT)x]≥0
另外Atxt=0
Atxt=(I−xtxtT)At−1(I−xtxtT)xt=0
不过,Asxts>t的值往往不是0
Schur complement deflation

Orthogonalized projection deflation
公式
At=(I−P(t))A(I−P(t))
P(t)是投影矩阵,满足:
P(t)TP(t)=P(t)
P(t)P(t)=P(t)
若
X=[x1,x2,…,xt]=QR
则:
P(t)=Q1...tQ1...tT(假设X的秩为t)
其中Q1...t为Q的前t列。
Orthogonalized Hotelling’s deflation
公式
At=At−1−qtqtTAt−1qtqtT
qt=∥(I−P(t−1))xt∥(I−P(t−1))xt
特点
XXX