前言

本篇博客出于学习交流目的，主要是用来记录自己学习中遇到的问题和心路历程，方便之后回顾。过程中可能引用其他大牛的博客，文末会给出相应链接，侵删！

DeepFool算法
特点：提出鲁棒性评估指标
论文原文：DeepFool: a simple and accurate method to fool deep neural networks

正文

之前的博客讲了FGSM算法，但是有人可能会有疑问，怎么确定 $\varepsilon$ 的大小，取值大小这会对算法效果产生很大影响，那么今天的这个算法可以避免这个问题。
文章首次提出了一个分类器鲁棒性的评估指标：
图像样本： $x$ ， $x\in \mathbb{R}^n$
分类器： $\hat{k}(x)$
对抗扰动： $r$
分类器在 $x$ 处的鲁棒性 $\Delta(x;\hat{k})$ ：

Δ (x; \hat{k}) := min_{r} {| | r | |}_{2} s . t . \hat{k} (x + r) \neq \hat{k} (x)

$\Delta(x;\hat{k}):=\min_{\textbf{r}}\left||\textbf{r}|\right|_2 \ \ s.t.\hat{k}(x+\textbf{r})\neq\hat{k}(x)$ 即x到分类边界的距离，下文会更详细理解。

分类器 $\hat{k}(x)$ 的鲁棒性：

ρ_{a d v} (\hat{k}) = E_{x} \frac{Δ (x; \hat{k})}{| | x | |_{2}}

$\rho_{adv}(\hat{k})=\mathbb{E}_{x}\dfrac{\Delta(x;\hat{k})}{||x||_2}$
样本离分类边界越远，样本2范数越小，评测数值越大表示越鲁棒。

我们先从二分类器看，多分类器可以看做是多个二分类器的共同作用。
二分类问题
二分类器： $\hat{k}(x)=sign(\textbf{w}^Tx+b):=sign(f(x))$
图为sign()函数

分类边界： $\mathscr{F}=\{x:f(x)=0\}$ ，分界线两边分别为正负类
扰动向量：
$\textbf{r}_{\star}(\textbf{x}_0):=\arg\min\limits_{\textbf{r}}||\textbf{r}||_2$
$s.t.\ sign(f(x_0+\textbf{r}))\neq sign(f(x_0))$
$=-\dfrac{f(x_0)}{||\textbf{w}||_2^2}\textbf{w}$

借助原文中的图例来看公式可以很好理解

其实这个公式可以理解为样本到分类边界的最短距离 $\frac{f\left ( x_{0} \right )}{\left \| \textbf{w} \right \|_{2}}$ 乘上法线方向的单位向量 $\frac{\textbf{w} }{\left \| \textbf{w} \right \|_{2}}$ ,因为始终指向分类边界方向，所以有个负号。

如果是迭代算法，那么扰动计算公式将变为：

a r g_{r_{i}} m i n {‖ r_{i} ‖}_{2} s u b j e c t t o f (x_{i}) + ▽ f {(x_{i})}^{T} r_{i} = 0

$arg_{r_{i}}min\left \| r_{i}\right \|_{2}\ subject\ to\ f\left ( x_{i} \right )+\bigtriangledown f\left ( x_{i} \right )^{T}r_{i}=0$

多分类问题
类标数： $c$ ，即映射空间 $\mathbb{R}^n \rightarrow \mathbb{R}^c$
分类函数： $f(x)=\textbf{W}^Tx+\textbf{b}$
分类器： $\hat{k}(x)=\arg\max\limits_{k}{f_k(x)}$ ， $f_k(x)$ 是向量 $f(x)$ 的第 $k$ 个维度，也可看做是第 $k$ 个子分类器。
扰动向量：
$\arg\min\limits_{\textbf{r}}||\textbf{r}||_2$
$s.t. \exists k: \textbf{w}^T_k(x_0+\textbf{r})+\textbf{b}_k\geq \textbf{w}^T_{\hat{k}(x_0)}(x_0+\textbf{r})+\textbf{b}_{\hat{k}(x_0)}$
其中 $\textbf{w}_k$ 是 $\textbf{W}$ 的第 $k$ 列，即第 $k$ 个子分类器的权值向量。
要使得分类结果改变，必须保证至少存在一个非原始类标的分类器结果大于原始分类函数结果。
第 $k$ 个分类边界： $\mathscr{F}_k=\{x:f_k(x)-f_{\hat{k}(x_0)}(x)=0\}$
$x_0$ 与所在的凸区域可由超平面 $P$ 围成：

P = ⋂_{k = 1}^{c} {x : f_{\hat{k} (x_{0})} (x) \geq f_{k} (x)}

$P=\bigcap\limits_{k=1}^{c}\{x:f_{\hat{k}(x_0)}(x)\geq f_{k}(x)\}$
这时候我们需要得到一个点到某分类函数边界的最小距离，即：

\hat{l} (x_{0}) = \arg min_{k \neq \hat{k} (x_{0})} \frac{| f_{k} (x_{0}) - f_{\hat{k} (x_{0})} (x_{0}) |}{| | w_{k} - w_{\hat{k} (x_{0})} | |_{2}}

$\hat{l}(x_0)=\arg\min\limits_{k\neq \hat{k}(x_0)}\dfrac{|f_k(x_0)-f_{\hat{k}(x_0)}(x_0)|}{||\textbf{w}_{k}-\textbf{w}_{\hat{k}(x_0)}||_2}$
同样用原文的图来帮助理解：

假设有4个类，

x_{0}

$x_0$ 属于原本第4类，那么我们可以根据

F_{k} = {x : f_{k} (x) - f_{4} (x) = 0}

$\mathscr{F}_k=\{x:f_k(x)-f_4(x)=0\}$ 确定一个超平面如图绿线围成。然后计算分别距离各个分类器的最小距离。

那么我们就得到最小扰动 $\textbf{r}_{\star}(x_0)$ ：

r_{⋆} (x_{0}) = \frac{| f_{\hat{l} (x_{0})} (x_{0}) - f_{\hat{k} (x_{0})} (x_{0}) |}{| | w_{\hat{l} (x_{0})} - w_{\hat{k} (x_{0})} | |_{2}^{2}} (w_{\hat{l} (x_{0})} - w_{\hat{k} (x_{0})})

$\textbf{r}_{\star}(x_0)=\dfrac{|f_{\hat{l}(x_0)}(x_0)-f_{\hat{k}(x_0)}(x_0)|}{||\textbf{w}_{\hat{l}(x_0)}-\textbf{w}_{\hat{k}(x_0)}||_2^2}(\textbf{w}_{\hat{l}(x_0)}-\textbf{w}_{\hat{k}(x_0)})$
如果是迭代则公式变为如下：

P = ⋂_{k = 1}^{c} {x : f_{k} (x_{i}) - f_{\hat{k} (x_{0})} (x_{i}) + ▽ f_{k} (x_{i})^{⊤} x - ▽ f_{\hat{k} (x_{0})} (x_{i})^{⊤} x \leq 0}

$P=\bigcap\limits_{k=1}^{c}\{x:f_{k}(x_i)-f_{\hat{k}(x_0)}(x_i)+\bigtriangledown f_{k}(x_i)^{\top}x -\bigtriangledown f_{\hat{k}(x_0)}(x_i)^{\top }x\leq 0 \}$

小结

由线性推广到非线性也一样，文章还给出了由2范数推广到 $l_{p}$ 范数，以及和FGSM算法的实验对比，有兴趣的可以详细看原文。

DeepFool对抗算法_学习笔记

前言

正文

小结

猜你喜欢