作者:Seyed-Mohsen Moosavi-Dezfooli, Alhussein Fawzi, Pascal Frossard École Polytechnique Fédérale de Lausanne
链接:https://arxiv.org/abs/1511.04599
摘要:

本文内容:
对于robustness的量化与计算;
DeepFool算法。
形式化
图像x∈图像空间Rn。
分类器k^(x)在点x处的鲁棒性Δ(x;k^):(几何意义是x到分类边界的距离)
Δ(x;k^):=minr||r||2 s.t.k^(x+r)≠k^(x)
其中
r是能够fool分类器的最小扰动。
分类器
k^(x)的鲁棒性:
ρadv(k^)=ExΔ(x;k^)||x||2
(点面距离越远,计算输入的样本度量越小,模型越健壮)
二分类问题
记k^(x)=sign(wTx+b):=sign(f(x))
分类边界F={x:f(x)=0}
扰动向量r⋆(x0):=argminr||r||2s.t. sign(f(x0+r))≠sign(f(x0))
=−f(x0)||w||22w
迭代算法如下:

多分类问题
label数:c
记分类函数f(x)=WTx+b
分类器k^(x)=argmaxkfk(x),fk(x)是向量f(x)的第k个维度。
扰动向量:argminr||r||2
s.t.∃k:wTk(x0+r)+bk≥wTk^(x0)(x0+r)+bk^(x0)
其中wk是W的第k列。、
几何意义为寻找x0与所在的凸区域P=⋂k=1c{x:fk^(x0)(x)≥fk(x)}边界的最小距离,即:
l^(x0)=argmink≠k^(x0)|fk(x0)−fk^(x0)(x0)|||wk−wk^(x0)||2
所以最小扰动
r⋆(x0)=|fl^(x0)(x0)−fk^(x0)(x0)|||wl^(x0)−wk^(x0)||22(wl^(x0)−wk^(x0))
当边界非线性时,把上述
w替换成
∇f((x))即可(如下算法2)

值得注意的是本算法的输出不是optimal的,但实验中已经能够大概率实现小幅度扰动了。