【论文快读】DeepFool: a simple and accurate method to fool deep neural networks(2016)

作者:Seyed-Mohsen Moosavi-Dezfooli, Alhussein Fawzi, Pascal Frossard École Polytechnique Fédérale de Lausanne
链接:https://arxiv.org/abs/1511.04599
摘要:
【论文快读】DeepFool: a simple and accurate method to fool deep neural networks(2016)
本文内容:
对于robustness的量化与计算;
DeepFool算法。

形式化

图像x图像空间Rn
分类器k^(x)在点x处的鲁棒性Δ(x;k^):(几何意义是x到分类边界的距离)

Δ(x;k^):=minr||r||2  s.t.k^(x+r)k^(x)

其中r是能够fool分类器的最小扰动。
分类器k^(x)的鲁棒性:
ρadv(k^)=ExΔ(x;k^)||x||2

(点面距离越远,计算输入的样本度量越小,模型越健壮)

二分类问题

k^(x)=sign(wTx+b):=sign(f(x))
分类边界F={x:f(x)=0}
扰动向量r(x0):=argminr||r||2s.t. sign(f(x0+r))sign(f(x0))
=f(x0)||w||22w
迭代算法如下:
【论文快读】DeepFool: a simple and accurate method to fool deep neural networks(2016)

多分类问题

label数:c
记分类函数f(x)=WTx+b
分类器k^(x)=argmaxkfk(x)fk(x)f(x)的第k个维度。
扰动向量:argminr||r||2
s.t.k:wkT(x0+r)+bkwk^(x0)T(x0+r)+bk^(x0)
其中wkW的第k列。、
几何意义为寻找x0与所在的凸区域P=k=1c{x:fk^(x0)(x)fk(x)}边界的最小距离,即:

l^(x0)=argminkk^(x0)|fk(x0)fk^(x0)(x0)|||wkwk^(x0)||2

所以最小扰动r(x0)=|fl^(x0)(x0)fk^(x0)(x0)|||wl^(x0)wk^(x0)||22(wl^(x0)wk^(x0))
当边界非线性时,把上述w替换成f((x))即可(如下算法2)
【论文快读】DeepFool: a simple and accurate method to fool deep neural networks(2016)
值得注意的是本算法的输出不是optimal的,但实验中已经能够大概率实现小幅度扰动了。