机器学习——LDA
步骤:
1 计算类内散度矩阵
2 计算类间散度矩阵
3 计算矩阵
4 计算矩阵的最大值的d个特征值
5 计算d个特征值对应的d个特征向量,计算投影矩阵为W
6 输出新样本集={(p1,y1),(p2,y2)...(pm,ym)}
具体推导:
定义:
j 类样本个数
j 类样本集合
j 类样本均值
j 类协方差矩阵
均值
协方差矩阵
主要目标思想:1 最大化类别的数据中心距离
2 最小化同类样本的协方差
类内散度:
类间散度:
优化目标:J(w)=
求导 => (注释:
与
为标量)
=>
这就转化成一个求取特征值与特征向量的问题,可以利用SVD分解
将得到的
计算矩阵的最大值的d个特征值
计算d个特征值对应的d个特征向量,计算投影矩阵为W
输出新样本集={(p1,y1),(p2,y2)...(pm,ym)}
对于多分类相似,不再赘述,可参考:https://zhuanlan.zhihu.com/p/27899927