学习《机器学习100天》第12天 支持向量机SVM
项目地址 https://github.com/MLEveryday/100-Days-Of-ML-Code
1、什么是SVM
有监督
可用于分类和回归,主要用于分类
根据特征值,构建n维空间,数据点投影到该空间
2、数据如何分类
找到一个超平面
3、如何定义最佳超平面
最大化一个距离,这个距离是到超平面最近的点的距离
4、线性和非线性数据
线性数据直接用超平面划分
非线性数据,需变换到另一个空间,再划分
5、参数
核函数(kernel):寻找超平面,就是通过线性袋鼠转化问题。通过核函数来完成。
正则化(regularization):较大时,选较小间距的超平面
系数(gamma):小的系数值,距离远的点也会用于计算
间距(margin):到最近点的分界线