机器学习Task3-SVM(支持向量机)

线性可分支持向量机是支持向量机的基础模型，使用的是硬间隔最大化，学习算法如下:
(1)构造并求解约束最优化问题
$\begin{aligned} &\min _{\boldsymbol{w}, b} \frac{1}{2}\|\boldsymbol{w}\|^{2}\\ &\text { s.t. } \quad y_{i}\left(w \cdot x_{i}+b\right)-1 \geqslant 0, \quad i=1,2, \cdots, N \end{aligned}$
(2)由此得到分离超平面
$w^{*} \cdot x+b^{*}=0$
分类决策函数
$f(x)=\operatorname{sign}\left(w^{*} \cdot x+b^{*}\right)$

2.2 线性支持向量机

若解线性分类问题出现一些特异点导致不能完全线性可分，此时可以引入惩罚项使间隔尽量大的情况，同时使误分类点的个数尽量小。
线性不可分的线性支持向量机的学习问题变成了如下的凸二次规划问题（原始问题）：
$\begin{array}{ll} \min _{w, b, \xi} & \frac{1}{2}\|w\|^{2}+C \sum_{i=1}^{N} \xi_{i} \\ \text { s.t. } & y_{i}\left(w \cdot x_{i}+b\right) \geqslant 1-\xi_{i}, \quad i=1,2, \cdots, N \\ & \xi_{i} \geqslant 0, \quad i=1,2, \cdots, N \end{array}$

2.3 非线性支持向量机

生活上大多是线性不可分的例子，这时可以使用非线性支持向量机。此方法在线性支持向量机的基础上引入了核技巧，通过核函数隐式将输入特征映射到高维的特征空间，然后在新空间里用线性分类学习方法从训练数据中学习分类模型。
常见的核函数有线性核、高斯核和多项式核。

3.训练过程

将原问题转化为对偶问题（已推出）
用SMO算法求解对偶问题（凸二次规划问题）
确定分离超平面和决策函数

机器学习Task3-SVM(支持向量机)

4.测试过程

决策函数判断wx+b，大于0，记为正例，反之为负例。

5.问题

1.什么是支持向量
线性可分时，即硬间隔时，支持向量位于间隔边界的样本。
2.支持向量机的推导
3.SVM的损失函数
计算最小间距和惩罚项。 $\min _{w, b, \xi} \quad \frac{1}{2}\|w\|^{2}+C \sum_{i=1}^{N} \xi_{i}$
4.SVM的核函数有哪些，核函数的作用是什么
常见的核函数有线性核、高斯核和多项式核。核函数可以将输入变量隐式由低维映射到高维，而不需要知道映射后的具体形式。
5.硬间隔和软间隔
硬间隔没有惩罚项，软间隔有，适合有特异点的线性基本可分的例子。
6.SVM可以做多分类吗，怎么做
可以，创建多个SVM,投票法决定最终类别。
7.SVM可以做回归吗，怎么做
可以，暂时未了解其中原理。
8.SVM的对偶问题，为什么要把原问题转化为对偶问题
将原问题化成对偶问题，有利于进行原问题的求解。
9.KKT限制条件有哪些
KKT出现在强对偶理论中，用于计算偏置b。
$\forall i=1 \sim N$ ,或者 $\alpha_{i}^{*}=0$ ，或者 $g *_{i}\left(w^{*}\right)=0$ 。

6.总结

机器学习Task3-SVM(支持向量机)

7.参考资料

1.李航-统计学习方法
2.浙江大学-研究生机器学习课程
3.感知机和SVM的区别

机器学习Task3-SVM(支持向量机)

SVM

1.名词解释

1.1 SVM

1.2 支持向量

1.3 分离超平面

1.4 间隔

2.模型

2.1 线性可分支持向量机

2.2 线性支持向量机

2.3 非线性支持向量机

3.训练过程

4.测试过程

5.问题

6.总结

7.参考资料

相关推荐