[机器学习-sklearn]什么是支持向量机SVM

1. SVM概念

支持向量机(Support Vector Machine,SVM)属于有监督学习模型,主要于解决数据分类问题。通常SVM用于二元分类问题,对于多元分类可将其分解为多个二元分类问题,再进行分类,主要应用场景有图像分类、文本分类、面部识别和垃圾邮件检测等领域。

2. SVM 解决的问题

[机器学习-sklearn]什么是支持向量机SVM

3. 模型基本思想

以一个二元分类问题为例讲解模型原理。首先假设有两类数据,如图需要找出一条边界来将两类数据分隔开来
[机器学习-sklearn]什么是支持向量机SVM
下图中列出一些可行的分隔方式。在当前的数据集的条件下,三种分隔方式都是可行的,我们该如何做选择?
[机器学习-sklearn]什么是支持向量机SVM
找到最优分类数据的分界线,使得对样本数据的分类效果更好的方法就是要尽可能地远离两类数据点,即数据集的边缘点到分界线的距离d最大这里虚线穿过的边缘点称作支持向量分类间隔为2d。如下图所示
[机器学习-sklearn]什么是支持向量机SVM

4. 支持向量机原理

SVM是从线性可分情况下的最优分类面发展而来的。
[机器学习-sklearn]什么是支持向量机SVM