Hinge loss 与二分类SVM
原文地址:http://breezedeus.github.io/2015/07/12/breezedeus-svm-is-hingeloss-with-l2regularization.html
SVM等于Hinge损失 + L2正则化
这里说的SVM是指最原始的2分类SVM,不考虑SVM的其他各种扩展。为简单起见,我们也只考虑线性SVM,对于带核函数的SVM,利用相似的推导我们可以获得相同的结论:
2分类SVM等于Hinge损失 + L2正则化。
下面是线性SVM的一般形式,其中目标分类y∈{−1,1},
C为给定的惩罚系数:
记m≜fθ(x)y(其中
y∈{−1,1}),那么对于2分类问题,最理想的损失函数是0/1损失函数。也就当
fθ(x)与
y有相同符号时,损失为0;而当
fθ(x)与
y有不同符号时,损失为1。但0/1损失函数既不是处处可微,又不是凸函数,所以直接最小化0/1损失函数很困难。Hinge损失是0/1损失的一种近似(见下图):
Hinge损失的名字是源自它跟打开135度的折叶(hinge)长得很像。
带有L2正则项的Hinge损失优化问题如下:
为了与前面的SVM表达式对应,我们把L2正则项中的惩罚系数挪到前面的Hinge损失上了。Hinge损失函数有如下的等价定义:
利用上面的等价定义,我们可以重写带有L2正则项的Hinge损失优化问题为:
嗯,上式就是本文最开始给出的SVM优化问题了。