对抗子空间维度探讨

引言

对抗样本是深度学习模型的主要威胁之一，对抗样本会使得目标分类器模型分类出错并且它存在于稠密的对抗子空间中，对抗子空间又包含于特定的样本空间中。本文主要是对对抗子空间维数进行探讨，即针对于单个模型的特定样本对抗子空间的维度是多少，针对多个模型的特定样本对抗子空间的维度是多少。

对抗子空间

给定干净样本 $x\in \mathbb{R}^d$ ，以及其对应的标签 $y$ ，带有参数 $\theta$ 的神经网络分类器为 $f_\theta(\cdot)$ ，损失函数为 $J(x,y;\theta)$ ，对抗样本为 $x^{\prime}$ ，则根据多元泰勒展开式可得 $J(x^{\prime},y;\theta)=J(x,y;\theta)+(x^{\prime}-x)^{\top}\nabla_x J(x,y;\theta)+O(\|x^{\prime}-x\|^2)$ 进一步可得优化目标为 $\begin{array}{rl}\mathrm{maximize}& J(x,y;\theta)+(x^{\prime}-x)^{\top}\nabla_x J(x,y;\theta)\\\mathrm{subject \text{ }to}& \|x^{\prime}-x\|_{\infty} \le \varepsilon\end{array}$ 进而可得对抗样本的计算公式为 $x^{\prime}=x+\varepsilon \cdot\nabla_x J(x,y;\theta)$ 其中 $\varepsilon$ 表示的是对抗扰动的大小。由上公式可知，干净样本 $x$ 沿着梯度方向 $\nabla_x J(x,y;\theta)$ 可以进入到对抗子空间中。进一步详细的阐述如下图所示，其中图（a）,（b）和（c）表示的是给定一个干净样本沿着不同的方向生成的样本输入到分类器分类的结果示意图，每个方格表示每一个样本的分类结果，方格中白色表示分类器分类正确，彩色表示分类器分类成其它不同的类别。图（d） ,（e）和（f）表示样本移动的方向分解示意图。
在这里插入图片描述
由上图（d）可知，如果选择两个正交方向，一个是对抗扰动的梯度方向，另一个是随机扰动方向，从图（a）可知，沿着对抗扰动方向的干净样本可以进入到对抗子空间中，沿着随机扰动的方向则没有生成对抗样本。由上图（e）可知，如果这两个正交方向与梯度方向成一个角度，则从图（b）可知这两个正交方向都可以进入到对抗子空间中，但是却不是最速方向。由上图（f）可知，如果这两个正交方向是都是随机扰动，从图（c）可知，干净样本都很难进入到对抗子空间中去，该图出现误分类的情况与对抗样本无关，跟模型自身的训练情况有关。

单模型对抗子空间维数

由上一节对对抗样本损失函数的多元泰勒展开可以近似有 $J(x^{\prime},y;\theta)\approx J(x,y';\theta)+(x^{\prime}-x)^{\top} \nabla_x J(x,y;\theta)$ 其中令 $\nabla_x J(x,y;\theta)\in \mathbb{R}^d$ ， $(x^{\prime}-x)\in \mathbb{R}^d$ 。目的是要探究给定一个模型，求解对抗扰动 $r$ 使得模型损失函数至少增长 $\alpha$ 得对抗子空间维度的问题，数学表述为 $\begin{aligned}J(x^{\prime},y;\theta)-J(x,y;\theta)&=r^{\top} g\ge \alpha\\\end{aligned}$ 其中 $\in \mathrm{Span}\{r_1,r_2\cdots,r_k\}$ ，即扰动 $r$ 属于 $r_1,r_2,\cdots,r_k$ 这 $k$ 个正交向量组成的对抗子空间中， $k$ 就是对抗子空间的维度。此时有如下定理成立，详细证明过程如下所示：

定理：给定 $\in \mathbb{R}^{d}$ 和 $\alpha \in[0,1]$ ，最大对抗子空间维数 $k$ 的正交向量 $r_1,r_2,\ldots,r_k$ 满足 $\left\|r_{i}\right\|_{2} \leq 1$ ， $g^{\top} r_{i} \geq \alpha \cdot\|g\|_{2}$ 的充要条件是 $k=\min \left\{\left\lfloor\frac{1}{\alpha^{2}}\right\rfloor, d\right\}$ 。

证明：
必要性证明： 已知 $\in \mathbb{R}^{d}$ 和 $\alpha \in[0,1]$ ，令 $\hat{r}_{i}:=\frac{r_{i}}{\left\|r_{i}\right\|_{2}}$ ，并且 $r_{1}, r_{2}, \ldots, r_{k}$ 是正交的，由此可知 $\leq d$ 。
（1）如果 $k = d$ ，则由向量乘积公式可知： $\sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2}=\sum_{i=1}^{d}\left|g^{\top} \hat{r}_{i}\right|^{2} = \sum_{i=1}^{d} \|g\|_{2}^{2} \|\hat{r}_{i}\|_{2}^{2} \cos^{2} \alpha_{i}$ 其中， $\cos \alpha_{i}$ 表示的是向量 $g$ 和 $\hat{r}_{i}$ 的余弦值，并且又知道 $\|\hat{r}_{i}\|_{2}^{2}=1$ ，所以有 $\sum_{i=1}^{d} \|g\|_{2}^{2} \|\hat{r}_{i}\|_{2}^{2} \cos^{2} \alpha_{i} = \|g\|_{2}^{2} \sum_{i=1}^{d} \cos^{2} \alpha_{i} = \|g\|_{2}^{2}$ 进而则有 $\sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2} = \|g\|_{2}^{2}$
（2）如果 $k < d$ ，则先对 $r_{1}, r_{2}, \ldots, r_{k}$ 进行正交扩充，扩充为 $r_{1}, r_{2}, \ldots, r_{k}, r_{k+1},\ldots, r_{d}$ 则可知 $\sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2}< \sum_{i=1}^{d}\left|g^{\top} \hat{r}_{i}\right|^{2} = \sum_{i=1}^{d} \|g\|_{2}^{2} \|\hat{r}_{i}\|_{2}^{2} \cos^{2} \alpha_{i} = \|g\|_{2}^{2}$ 进而可知 $\|g\|_{2}^{2} \geq \sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2}$ 又因为 $\hat{r}_{i}:=\frac{r_{i}}{\left\|r_{i}\right\|_{2}}$ ，所以有 $\sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2} = \sum_{i=1}^{k}\left|g^{\top} \frac{r_{i}}{\left\|r_{i}\right\|_{2}} \right|^{2} \geq \sum_{i=1}^{k} \frac{\left|g^{\top} r_{i}\right|^{2}}{\left\|r_{i}\right\|_{2}^{2}}$
因为 $g^{\top} r_{i} \geq \alpha \cdot\|g\|_{2}$ ， $\left\|r_{i}\right\|_{2} \leq 1$ ，所以有 $\sum_{i=1}^{k} \frac{\left|g^{\top} r_{i}\right|^{2}}{\left\|r_{i}\right\|_{2}^{2}} \geq k \cdot \alpha^{2} \cdot\|g\|_{2}^{2}$ 又因为 $\leq \left\lfloor\frac{1}{\alpha^{2}}\right\rfloor$
最终有 $\max\{k\} = \min\{ \left\lfloor\frac{1}{\alpha^{2}}\right\rfloor,d\}$

充分性证明： 已知 $k=\min \left\{\left\lfloor\frac{1}{\alpha^{2}}\right\rfloor, d\right\}$ ，令 $e_{1}, e_{2}, \dots, e_{d}$ 表示的是 $\mathbb{R}_{d}$ 的基向量， $R$ 为旋转矩阵并且有 $g=\|g\|_{2} \cdot e_{1}$ 。令 $z:=\sum_{i=1}^{k} k^{-\frac{1}{2}} \cdot e_{i}$ ，并且 $S$ 为旋转矩阵，所以有 $S z=\|z\|_{2} e_{1}= e_{1}$
易知，矩阵 $Q:=S^{\top} R$ 为旋转矩阵，其满足 $S^{\top} R g = \|g\|_{2} S^{\top} e_1 = \|g\|_{2} z$
令向量 $r_{i}:=Q^{\top} e_{i}$ ，并且 $\leq i \leq k$ ，其中 $r_i$ 是矩阵 $Q$ 的第 $i$ 列， $Q$ 是正交矩阵，进而可知： $g^{\top} r_{i}=(Qg)^{\top}e_{i} = \|g\|_{2} \cdot z^{\top} e_{i}=\|g\|_{2} \cdot k^{-\frac{1}{2}} \geq\|g\|_{2} \cdot \alpha$
证毕！

通过以上的证明可以得到一个非常严谨漂亮的结论，即对抗子空间的维度 $k$ 大小与损失函数增长程度 $\alpha$ 的平方成反比，这也是很符合直观理解。增长程度越大，对抗子空间就越往梯度方向坍缩，因为梯度方向是最速方向。

多模型对抗子空间维数

在黑盒模型中，经常会利用到对抗样本的可迁移性进行攻击，即利用模型 $f_{\theta}$ 生成的对抗样本 $x^{\prime}$ ，迁移未知分类模型 $g_\eta$ 中进行攻击，其主要原因在于针对两个不同的模型有重叠的对抗子空间，所以才会使得对抗样本有攻击的可迁移性。假定 $r$ 表示的是样本 $x$ 针对模型 $f_\theta$ 的使得其损失函数增长 $\alpha$ 的对抗扰动； $s$ 表示的是样本 $x$ 针对模型 $g_\eta$ 的使得其损失函数增长 $\alpha$ 的对抗扰动。其中 $\in \mathrm{Span}\{r_1,r_2\cdots,r_k\}$ ，即扰动 $r$ 属于 $r_1,r_2,\cdots,r_k$ 这 $k$ 个正交向量组成的对抗子空间中。其中 $\in \mathrm{Span}\{s_1,s_2\cdots,s_l\}$ ，即扰动 $s$ 属于 $s_1,s_2,\cdots,s_l$ 这 $l$ 个正交向量组成的对抗子空间中；则此时针对多个模型对抗子空间维度的大小为 $q=\mathrm{dim}\{\mathrm{Span}\{r_1,r_2,\cdots,r_k\}\bigcap\mathrm{Span}\{s_1,s_2,\cdots,s_l\}\}$ 同理根据以上推导思路可以求出3个模型以上重叠的对抗子空间的维度。