第13周周报(11.22-11.28) About influence function

原文：Understanding Black-box Predictions via
Influence Functions
目标：训练数据的某一个数据改变，预测结果会有怎样的变化(影响)？
设：input space $X$ ,output space $Y$ , 训练集： $z_i =(x_i,y_i) \in X \times Y,i=1,2,\dots,n$ ;对于一个点 $z$ 以及模型参数 $\theta \in \Phi,L(z,\theta)$ 为损失函数。最小化经验函数为：
$\hat{\theta}=\arg \min_{\theta \in \Phi} \frac{1}{n} \sum_{i=1}^{n}L(z_i,\theta) \tag 1$
再理一遍目标：某一个数据变化，即 $z$ 变化，可以视为 $z$ 从有到无，预测结果发生的变化；换句话说：训练时， $z$ 从有到无，导致模型参数 $\hat{\theta}$ 发生变化，从而引起预测结果的变化，如何衡量影响的大小？（求导）
模型参数的变化： $\hat{\theta}_{-z}-\hat{\theta}$ ；（移除 $z$ 的参数减去未移除时的参数）
其中： $\hat{\theta}_{-z}=\arg \min_{\theta \in \Phi} \frac{1}{n} \sum_{i=1,z_i \neq z}^{n}L(z_i，\theta) \tag 2$

问题1：原文作者写法(下面截图)与上式不一致，不知道是不是我没有深刻理解作者的思路，还是作者有意为之，那作者为何不要求平均了呢？按照最小化经验函数是需要求平均啊，emmm…所以应该怎样理解？

继续换个思路： $n$ 个 $z$ ，一个一个移除观察参数的变化，太慢了，根据influence function:可以在 $z$ 上加一个小小的权重 $\epsilon$ 来计算参数的变化.更神奇的是，移除 $z$ 相当于加权 $\epsilon=-\frac{1}{n}$ .
加权后的参数定义为： $\hat{\theta}_{\epsilon,z}=\arg \min_{\theta \in \Phi}\frac{1}{n}\sum_{i=1}^{n}L(z_i,\theta)+\epsilon L(z,\theta) \tag 3$
对 $z$ 加权后，对模型参数 $\hat{\theta}$ 的影响(梯度)定义为：
$I_{\mathrm{up，params}}(z)=\frac{\mathrm{d}\hat{\theta}_{\epsilon,z}}{\mathrm{d}\epsilon}\vert _{\epsilon=0}=-\mathbf{H}^{-1}_{\hat{\theta}}\nabla_{\theta}L(z,\hat \theta) \tag 4$
其中： $\mathbf{H}_{\hat \theta}=\frac{1}{n}\sum_{i=1}^{n}\nabla^2_{\theta} L(z_i, \hat \theta)$ 为正定海瑟矩阵.

问题2：用 $\epsilon$ 对 $z$ 加权重，为什么加在loss上？
问题3：为什么式子 $(3)$ 对 $\epsilon$ 求导得到式子 $(4)$ 的结果？原文表示是根据经典的结果，引用是一本书，所以还没有深入探究结果的由来。
问题4： 根据牛顿法 $x^{(k+1)}=x^{(k)}+\alpha_k d_k$ ，下降方向 $d_{k}=-H_k^{-1}g_k,\alpha_k=1$ ，其中 $d_{k}$ 为第k步的方向， $H_k$ 为函数的第k步海瑟矩阵， $g_k$ 为函数的第k步梯度， $\alpha_k$ 为第k步步长。表达式含义：根据第k步的位置 $x^{(k)}$ ，往方向 $d_k$ 移动步长 $\alpha_k=1$ 为距离得到下一步的迭代点 $x^{(k+1)}$ ;
将牛顿法的下降方向与 $I_{\mathrm{up，params}}(z)$ 类比，即 $I_{\mathrm{up，params}}(z)$ 为在 $\hat \theta$ 附近二次逼近经验风险函数，且步长为1.
原文也说明了是经验风险函数的二次逼近且步长为1，虽然论文说有附录证明，但是论文中并没有找到证明的附录，所以以上是我个人的理解。

移除 $z$ 相当于加权 $\epsilon=-\frac{1}{n}$ ，即当 $\epsilon=-\frac{1}{n}$ 时，式子 $(2)$ 和 $(3)$ 相等，线性近似移除 $z$ 后的参数变化：
$\hat \theta_{-z}-\hat \theta \approx -\frac{1}{n}I_{\mathrm{up，params}}(z) \tag 5$

问题5：其实这一步没看懂，线性近似怎么就得到了式子 $(5)$ 呢？

补充： 如果式子 $(2)$ 所对应的原文截图是无歧义的，那么可否这样理解：
由： $f(x+\Delta x)-f(x)=\Delta x \nabla f(x)$
$\begin{aligned}\hat \theta_{-\frac{1}{n},z}-\hat \theta &\approx -\frac{1}{n}I_{\mathrm{up，params}}(z)\\ \hat\theta_{-\frac{1}{n},z}& \approx \hat \theta_{-z}\\ \hat \theta_{-z}-\hat \theta &\approx -\frac{1}{n}I_{\mathrm{up，params}}(z)\end{aligned}$
似乎这样的理解是错误的(勿看)

在对 $z$ 加权训练后，对于测试集中的某一个 $z_{\mathrm{test}}$ 有什么变化呢？即求导：
$\begin{aligned}I_{\mathrm{up,loss(z,z_{test})}} &=\frac{\mathrm{d}L(z_{\mathrm{test}}，\hat \theta_{\epsilon,z})}{\mathrm{d}\epsilon} \vert_{\epsilon=0} \\ &=\nabla_{\theta}L(z_{\mathrm{test},\hat \theta})^{\mathrm{T}} \frac{\mathrm{d}\hat \theta_{\epsilon,z}}{\mathrm{d}\epsilon}\vert_{\epsilon=0} \\ &=- \nabla_{\theta}L(z_{\mathrm{test},\hat \theta})^{\mathrm{T}}\mathbf{H}^{-1}_{\hat{\theta}}\nabla_{\theta}L(z,\hat \theta) \tag 6\end{aligned}$

那么，由于删去一个样本等同于权重增加 $-\frac{1}{n}$ ，因此，删除一个样本z后，模型在测试样本 $z_{\mathrm{test}}$ 上的loss会增加 $-\frac{1}{n}I_{\mathrm{up,loss(z,z_{test})}}$ .

以上都是铺垫，下面才是主题：

个人理解：对某个点 $z$ 添加扰动 $\delta$ ： $z=(x,y)\rightarrow z_{\delta}=(x+\delta,y),$ 找到此扰动对测试集的某个点 $z_{\mathrm{test}}$ 的影响,如果影响大，则 $z$ 的改变对数据来说很敏感，对于APT那篇paper来说，希望找到的是EMR用户("正向"用户，是不敏感的数据)来通过对抗性训练达到增强推荐系统鲁棒性的作用

$\delta$ 从无到有，参数变成了： $\hat \theta_{z_\delta,-z}$ ;
移除 $\delta$ 或者增加 $\delta$ 相当于对它加权：
$\hat \theta_{\epsilon,z_{\delta},-z}=\arg \min_{\theta \in \Phi}\frac{1}{n}\sum_{i=1}^{n}L(z_i,\theta)+\epsilon L(z_{\delta,\theta})-\epsilon L(z,\theta) \tag 7$
由式子(4)的形式得：
$I=\frac{\mathrm{d}\hat \theta_{\epsilon,z_{\delta},-z}}{\mathrm{d}\epsilon}\vert_{\epsilon=0}=-\mathbf{H}_{\hat \theta}^{-1}(\nabla_\theta L(z_{\delta},\hat \theta)-\nabla_\theta L(z,\hat \theta)) \tag 8$
设 $\in \mathbb{R}^d$ ,由于 $\| \delta\| \rightarrow 0$ ,故 $\nabla_\theta L(z_{\delta},\hat \theta)-\nabla_\theta L(z,\hat \theta) \approx \nabla_x \nabla_{\theta }L(z,\hat \theta)\delta$
得式子 $(8)$ 为:
$\frac{\mathrm{d}\hat \theta_{\epsilon,z_{\delta},-z}}{\mathrm{d}\epsilon}\vert_{\epsilon=0}=I_{\mathrm{up,params}}(z_\delta)-I_{\mathrm{up,params}}(z)=-\mathbf{H}_{\hat \theta}^{-1}\nabla_x \nabla_{\theta }L(z,\hat \theta)\delta \tag 9$
根据式子 $(5)$ 同理得：
$\hat \theta_{\epsilon,z_{\delta},-z}-\hat \theta \approx -\frac{1}{n}(\mathbf{H}_{\hat \theta}^{-1}\nabla_x \nabla_{\theta }L(z,\hat \theta)\delta$
由式子 $(6)$ 同理可得：
$\begin{aligned}I_{\mathrm{pert,loss}}(z,z_{\mathrm{test}})^{\mathrm{T}}&=\nabla_\delta L(z_{\mathrm{test}},\hat \theta_{z_\delta,-z})^{\mathrm{T}} \vert _{\delta=0} \\ &=-\nabla_{\theta}L(z_{\mathrm{test}},\hat \theta)^{\mathrm{T}}\mathbf{H}_{\hat \theta}^{-1}\nabla_x \nabla_{\theta }L(z,\hat \theta)\end{aligned}$

由此可得结论：

当 $\rightarrow z_\delta$ 时，对 $z_{\mathrm{test}}$ 的影响近似为 $I_{\mathrm{pert,loss}}(z,z_{\mathrm{test}})^{\mathrm{T}}\delta;$
如果设置 $\delta$ 的方向为 $I_{\mathrm{pert,loss}}(z,z_{\mathrm{test}})$ 时，得到在 $z_{\mathrm{test}}$ 的损失最大.

第13周周报(11.22-11.28) About influence function

猜你喜欢