LLE降维

LLE 是 Locally Linear embedding
LLE降维
直观是在样本点的高维空间相邻近的话,可以用低维的子空间描述。

基本原理分三步:
(1) 找到邻居 neighbors .(可以使用多种方法,邻居K的数目选择影响很大)
(2)使用周围的邻居作为基向量, reconstruct with linear weights
minimize reconstruction error.

minWε(W)=ixijNiWijxj22\underset{W}{min}\varepsilon (W) = \sum_i||x_i - \sum_{j\in N_i}W_{ij}x_j||^2_2,

ixijNiWijxj22=jWij(xixj)22=jkWijWikGjk=WiTGWi\sum_i||x_i - \sum_{j\in N_i}W_{ij}x_j||^2_2=\sum_j||W_{ij}(x_i-x_j)||^2_2=\sum_{jk}W_{ij}W_{ik}G_{jk}=W_i^TGW_i,

Gjk=(xixj)T(xixk),j,kNiG_{jk}=(x_i-x_j)^T(x_i-x_k), \forall j,k \in N_i
使用拉格朗日方法:

2GWiλI=0,jWij=12GW_i-\lambda I=0, \sum_jW_{ij}=1

Wi=G1IITG1IW_i = \frac{G^{-1}I}{I^TG^{-1}I}

s.t.jWij=1,is.t. \sum_jW_{ij}=1 , \forall _i

为了防止G病态多个解,加入二范数
minWiWiTGWi+γWiTWimin_{W_i}W_i^TGW_i + \gamma W_i^TW_i
得到
2(G+γI)WiλI=02(G+\gamma I)W_i - \lambda I=0

Wi=(G+γI)1IIT(G+γI)1IW_i = \frac{(G+\gamma I)^{-1}I}{I^T(G+\gamma I)^{-1}I}

(3) Map to embedding coordinates
minYϕ(Y)=iyijNiWijyi22\underset{Y}{min}\phi(Y) = \sum_i||y_i-\sum_{j \in N_i}W_{ij}y_i||^2_2

对y要做约束,不然有很多解,比如平移。

s.t.iyi=0,1NiyiyiT=Is.t. \sum_iy_i=0, \frac{1}{N}\sum_iy_iy_i^T=I

解决方法拉格朗日方法 , eigenvalue problem
F=12iyijWijyj2212αβλαβ(1Niyiαyiβδαβ)F=\frac{1}{2}\sum_i||y_i-\sum_jW_{ij}y_j||^2_2-\frac{1}{2}\sum_{\alpha \beta}\lambda_{\alpha \beta}(\frac{1}{N}\sum_iy_i\alpha y_i \beta - \delta\alpha \beta)

(1W)T(1W)Y=1NYΛ,whereΛαβ=λαβ(1-W)^T(1-W)Y = \frac{1}{N}Y\Lambda, where \Lambda_{\alpha \beta} = \lambda _{\alpha \beta}