机器学习6——SVM
1、支持向量机
在本练习的前半部分,您将使用支持向量机(SVM)具有各种示例2D数据集。 试验这些数据集将帮助您直观了解SVM的工作原理以及如何使用高斯分布内核与SVM。
在练习的下半部分,您将使用支持矢量机器来构建垃圾邮件分类器。提供的脚本ex6.m将帮助您逐步完成上半部分练习。
1.1数据集
示例1
我们将从一个2D示例数据集开始,该数据集可以用a分隔线性边界。 脚本ex6.m将绘制训练数据(图1)。 在这个数据集,正例的位置(用+表示)和负面例子(用o表示)表明指示了自然分离差距。 但是,请注意有一个异常值正例+最左边的大约(0.1,4.1)。 作为本练习的一部分,您还将了解如何操作此异常值影响SVM决策边界。
在本练习的这一部分中,您将尝试使用不同的C值SVM参数。 非正式地,C参数是正值控制错误分类训练样例的惩罚。 一个大的C参数3告诉SVM尝试正确分类所有示例。 C扮演一个角色类似于1/λ,其中λ是我们使用的正则化参数以前用于逻辑回归。