林轩田机器学习基石笔记(第25节)——VC Bound

在第23-24节我们已经找到了上限函数mH(N),那么是否把它代入到霍夫丁不等式就OK了呢?答案是否定的,我们最终会经过一系列证明把霍夫丁不等式变成如下的样子:
林轩田机器学习基石笔记(第25节)——VC Bound
上面的式子最后会变成如下:
林轩田机器学习基石笔记(第25节)——VC Bound
以下是证明步骤:

第一步,把无限的Eout(N)变成有限个

在霍夫丁不等式中,我们知道Ein(N)是有限的,但是Eout(N)是无限的,这对我们的计算是极为不利的,所以我们要想办法把Eout(N)也变为有限多个,这样计算起来就简单很多了。

那么要怎么样才能使Eout(N)变成有限个呢?办法是有的,假设我们有一个测试集D,该测试集的数据量为有限的N个,那么原来的Eout(N)其实就相当于测试机的Ein,此处我们为了方便区别,我们令为Ein.那么这三者的关系可以用下图来表示:
林轩田机器学习基石笔记(第25节)——VC Bound
从上图可以看出,如果EinEoout很远,则Ein也离Ein很远。

现在我们就可以用Ein来代替Eout了,但是要加入一些常数(如下图圈起部分),我们可以不管这些常数是怎么来的,因为展开讲会十分麻烦,所以先记住吧。
林轩田机器学习基石笔记(第25节)——VC Bound

接下来的第二三步证明我这边也听不懂,这里就不进一步展开了,我们只要记住结论就好了,先跳过吧,知道的同学可以加群讨论。

===========================懵逼分割线===========================

欢迎大家加入Q群讨论:463255841

===========================懵逼分割线===========================