[DataAnalysis]机器学习算法——支持向量机SVM原理简介

一、问题和超平面描述

给定训练集[DataAnalysis]机器学习算法——支持向量机SVM原理简介

分类学习最基本的想法就是基于训练集[DataAnalysis]机器学习算法——支持向量机SVM原理简介在样本空间中找到一个划分超平面,将不同类别的样本分开,但能将训练样本分开的划分超平面可能有很多,如下图所示:

[DataAnalysis]机器学习算法——支持向量机SVM原理简介

直观来看,应该去找位于两类训练样本“正中间”的划分超平面,因为该平面受影响最小,从而产生的分类结果是最鲁棒的,对未见示例的泛化能力最强。

1、划分超平面记

[DataAnalysis]机器学习算法——支持向量机SVM原理简介

2、样本空间中任意点到超平面的距离

[DataAnalysis]机器学习算法——支持向量机SVM原理简介

3、支持向量

[DataAnalysis]机器学习算法——支持向量机SVM原理简介

[DataAnalysis]机器学习算法——支持向量机SVM原理简介

如上图所示:距离超平面最近的几个训练样本点使上式的等号成立,他们被称为“支持向量”。两个异类支持向量到超平面的距离之和为:

[DataAnalysis]机器学习算法——支持向量机SVM原理简介

被称为间隔。从而我们的目标转为找到最大间隔的划分超平面。

二、支持向量机目标函数

[DataAnalysis]机器学习算法——支持向量机SVM原理简介   等价于[DataAnalysis]机器学习算法——支持向量机SVM原理简介

[DataAnalysis]机器学习算法——支持向量机SVM原理简介

三、SVM参数求解

1、对支持向量机目标函数使用拉格朗日乘子法

[DataAnalysis]机器学习算法——支持向量机SVM原理简介

2、对[DataAnalysis]机器学习算法——支持向量机SVM原理简介求偏导等于0得到[DataAnalysis]机器学习算法——支持向量机SVM原理简介的表达式

3、消去[DataAnalysis]机器学习算法——支持向量机SVM原理简介中的[DataAnalysis]机器学习算法——支持向量机SVM原理简介得到对偶问题

[DataAnalysis]机器学习算法——支持向量机SVM原理简介

[DataAnalysis]机器学习算法——支持向量机SVM原理简介

四、SVM重要性质

训练完成后,大部分的训练样本都不需保留,最终模型只与支持向量机有关。

五、其他

关于核函数和支持向量回归暂时不放在SVM简介中,后续将会更新在博客中。