2.1Minsky和Papert指出:
感知机因为是线性模型,
所以不能表示复杂的函数,如异或。
验证感知机为什么不能表示异或
参考链接:
https://blog.****.net/yangfeisc/article/details/45486067
2.2,换下数据即可,具体代码实现参考:
https://blog.****.net/appleyuchi/article/details/82928881
2.3
样本集线性可分的充分必要条件是:
正实例点集构成的凸壳与负实例点集所构成的凸壳互不相交
首先是概念:
这里的凸壳≠凸集。
“相交”的意思是:一个样本点,既属于凸壳A,也属于凸壳B,
也就是说,某个样本点同时满足两个集合的约束条件。

凸壳到底是一个什么鬼?????
看下面的初中数学课件回顾一下:

证明如下:
必要性:线性可分->凸壳不相交
设数据集T中的正例点集为S+,
S+的凸壳为conv(S+),
负实例点集为S−,
S−的凸壳为conv(S−),
若T是线性可分的,则存在一个超平面:w⋅x+b=0能够将S+和S−
完全分离。
假设对于所有的正例点xi,有:
w⋅xi+b=εi易知εi>0,i=1,2,⋯,∣S+∣。
若conv(S+)和conv(S−)相交,即存在某个元素s,
同时满足s∈conv(S+)和s∈conv(S−)。
对于conv(S+)中的元素s+
有w⋅s+=w⋅i=1∑kλixi=i=1∑kλi(εi−b)=i=1∑k(λiεi−bλi)
注意,这里因为凸壳(convex hull)的性质,有:
∑i=1kλi=1
所以上面的结果是:
i=1∑k(λiεi)−b
因此w⋅s++b=∑i=1kλiεi>0,
同理对于S−中的元素s−有
w⋅s−+b=∑i=1kλiεi<0,
线性可分条件下,假设两个凸壳相交,那么存在样本点s同时满足
s∈conv(S+)且s∈conv(S−)
则w⋅s++b=w⋅s+b=∑i=1kλiεi>0①
且w⋅s−+b=w⋅s+b=∑i=1kλiεi>0②
②违反了假设的前提:线性可分。
因为线性可分时,必须有②<0
所以假设不成立,因此conv(S+)和conv(S−)必不相交
从而推出必要性:线性可分->凸壳不相交
充分性:凸壳不相交->线性可分
设数据集T中的正例点集为S+,S+的凸壳为conv(S+),负实例点集为S−,S−的凸壳为conv(S−),且conv(S+)与conv(S−)不相交,
定义两个点x1,x2的距离为
dist(x1,x2)=∣∣x1−x2∣∣2=(x1−x2)⋅(x1−x2)
定义conv(S+)与conv(S−)的距离为,
dist(conv(S+),conv(S−))=min∣∣s+−s−∣∣,s+∈conv(S+),s−∈conv(S−)
设x+∈conv(S+),x−∈conv(S−)且dist(x+,x−)=dist(conv(S+),conv(S−))。
则对于任意正例点x有dist(x,x−)≥dist(x+,x−)。
注意,这里的(x+,x−)是用来代表S+和S−最近距离的两个点。
同理,对于所有的负例点x有dist(x,x+)≥dist(x,x−)。
存在超平面w⋅x+b=0其中
w=x+−x−
b=−2x+⋅x+−x−⋅x−
(以上就是两个技巧)
则对于所有的正例点x(易知w⋅x++b>0,因此若x+属于正例点,则令x+̸=x),
w⋅x+b
=(x+−x−)⋅x−2x+⋅x+−x−⋅x−
=x+⋅x−x−⋅x−2x+⋅x+−x−⋅x−
=2∣∣x−−x∣∣22−∣∣x+−x∣∣22
=2dist(x,x−)2−dist(x,x+)2
(这里我觉得不用搞得跟下面一样麻烦,只要分别在两个凸壳中各自取一个点,就能说明上面的式子的符号想相反的了,然后就得证了。)
若dist(x,x−)≤dist(x,x+),
则dist(x,x−)≤dist(x,x+)≤dist(x−,x+),
那么dist(S+,S−)<dist(x+,x−)(注:证明过程见下方),
推出矛盾。
因此对所有的正例点,w⋅x+b>0成立。
同理,对所有的负例点,w⋅x+b<0成立。
至此,充分性:凸壳不相交->线性可分
补充:用反正法证明dist(x,x−)>dist(x,x+)
证明:若dist(x,x−)≤dist(x,x+),
则存在t=∣∣x−x+∣∣22(x−−x+)⋅(x−x+),
令x′=tx+(1−t)x+,则(x−−x′)⋅(x+−x)=0。
易知t≤1先证明0<t,我们可以将x,x_{+},x_{-}看作是空间中三个不同的点,三条边的长度分别为dist(x,x+),dist(x,x−),dist(x−,x+)
由上文知dist(x,x+)≥dist(x,x−)≥dist(x−,x+)
根据三角形的大边对应大角这一特性,很容易可以看出
$x_{+}-x与x_{+}-x_{-}之间的夹角小于90度,
因此t>0。
那么
dist(x′,x−)<dist(x+,x−),
又因为x′必在conv(S+)内部,
所以推出矛盾。
本文来自 蓝色骨头零号 的**** 博客 ,全文地址请点击:https://blog.****.net/y954877035/article/details/52210734?utm_source=copy