【支持向量机】学习纪录（关于对支持向量机核函数的理解、代价函数）

关于支持向量机，没有尝试去使用代码去实现，而是重点试着增加对支持向量机工作原因的理解。以下是学习笔记。

PART ONE: 关于对支持向量机核函数的理解
【支持向量机】学习纪录（关于对支持向量机核函数的理解、代价函数）
针对上图中：
选择三个点l(1)、l(2)、l(3)，那么针对一个点X(i)到l(1)、l(2)、l(3)三个点的距离，按照正常的思维逻辑来理解：如果l(1)、l(2)是正样品，那么x(i)离这两个点越近，代表最终y=1的机率应该是越高的；反之，如果远离这两个点，则代表y=0的机率应该是越高的。
带着这个现象，我们再看下支持向量机的核函数。
假设：y=θ₀+θ₁*f1+θ₂*f2;
其中f1,f2是核心函数。
设：f=exp(-||x-l(i)||²/2σ²)
这里面涉及到的几个数学公式：
1、exp(f(x))，f(x)代表一个复合函数（不要和上面的f1、f2混了，这是两个东西），那么这就代表是以e为底数，f(x)为指数的方程，数学曲线如下：
【支持向量机】学习纪录（关于对支持向量机核函数的理解、代价函数）
我们实际在使用exp(f(x))函数时，真正使用到，其实上面红线框出一部分内容，因为这里的f(x)=-||x-l(i)||²/2σ²，这里面的x∈(-∞,0]。
从这里面可以看到，如果x和l(i)两个重合或者非常接近，则-||x-l(i)||²–>0，则f(x)=1;相反，如果x点远离l(i)点，则-||x-l(i)||²值就会变小，f(x)–>0
2、||x-l(i)||²代表x点到l(i)的距离。

PART TWO：代价函数

【支持向量机】学习纪录（关于对支持向量机核函数的理解、代价函数）

C过大，可能导致过拟合；
C过小，可能导致欠拟合；
原因：主要是由于参数C决定着两个部分（Part1，Part2）的权重，如果C过大，则Part1部分的数据调整，对整体的影响较大，则会尽量会去降低Part1的值，从而导致过拟合现象的产生；

【支持向量机】学习纪录（关于对支持向量机核函数的理解、代价函数）

相关推荐