线性判别分析(LDA)模型

基本原理

给定训练样集,设法将样例投影到一条直线上,使得同类样例的投影点尽可能的接近,异类样本点尽可能地远离;在对新样本进行分类的时候,将其投影到同样的这条线上面,根据投影点的位置来确定样本的类别。

公式推导过程

二维示意图如下:
线性判别分析(LDA)模型
二分类投影函数:y=wTx
i(Diimi=1nixDix
类别投影后的中心点为:m˜i=wTmi
衡量类别i投影后,类别点之间的分散程度(方差)为:s˜i=yYi(ym˜i)2
则LDA投影到w后的损失函数:J(w)=|m˜1m˜2|2s˜12+s˜22·······1
优化目标:类别中心点之间的距离越远越好,同类别数据分散程度越小越好;所以损失函数J(w)
m˜is˜i分别带入1式,得到如下方程:

J(w)=wT(m1m2)(m1m2)TwyY1wT(xm1)(xm1)Tw+yY2wT(xm2)(xm2)Tw

定义:
类内散度:Si=yYiwT(xmi)(xmi)Tw
类间散度:SB=(m1m2)(m1m2)T
则优化目标J(w)为:

J(w)=wTSBwwTSwwSw=S1+S2

wTSww=1则上式等价于:
minwwTSBw

s.t.wTSww=1

拉格朗日乘子法求解:
将有约束的优化问题变为无约束的问题,上述问题可以用拉格朗日乘子法求解:
f(w)=wTSBwλ(1wTSww)

f(w)求导:
df(w)dw=2SBw2λSww=0
得到:
SBw=λSww

因此,转化为一个求特征值的问题,我们求出第i大的特征向量,就是对应的wi了。