非线性SVM与核函数
核技巧
非线性分类问题
用线性分类的方法求解非线性分类问题分为两步:
首先使用一个变换将原空间的数据映射到新空间;
然后在新空间里利用线性分类学习方法从训练数据中学习分类模型。核技巧就是这种方法。
核技巧应用到SVM,基本想法是通过一个非线性变换将输入空间对应于一个特征空间,使得在输入空间中的超曲面模型对应于特征空间中的超平面模型(SVM)。这样,分类问题的学习任务通过在特征空间中求解线性SVM就可以完成。
核函数的定义
称
核技巧的想法是,在学习和预测中只定义核函数
核技巧在SVM中的应用
在线性SVM的对偶问题中,目标函数和决策函数都只涉及输入实例与实例之间的内积。对偶问题的目标函数中的内积
目标函数变为
分类决策函数成为
当映射函数是非线性函数时,学习到的含有核函数的SVM就是非线性分类模型。
在核函数给定的条件下,可以利用解线性分类的方法求解非线性分类问题的SVM。学习是隐式地在特征空间中进行的,不需要显式地定义特征空间和映射函数。
正定核
常用核函数
多项式核函数
对应的SVM是一个d次多项式分类器。
高斯核函数
对应的SVM是高斯径向基函数(radial basis function)分类器。
如果把惩罚系数C和RBF核的
sigmoid核函数
字符串函数
核函数不仅可以定义在欧式空间上,还可以定义在离散数据的集合上。
非线性SVM算法
参考文献
《统计学习方法》第7章
机器学习 小象学院