一文读懂对抗机器学习Universal adversarial perturbations | CSDN博文精选 - 代码天地

一文读懂对抗机器学习Universal adversarial perturbations | CSDN博文精选

其他 2019-10-25 11:16:10 阅读次数: 0

原文链接： https://blog.csdn.net/jmh1996/article/details/102508703

640?wx_fmt=jpeg

作者 | Icoding_F2014

来源 | CSDN博客

本文提出一种 universal 对抗扰动，universal 是指同一个扰动加入到不同的图片中，能够使图片被分类模型误分类，而不管图片到底是什么。示意图：

640?wx_fmt=png

形式化的定义：

对于d维数据分布 μ，里面的每一个样本 640?wx_fmt=png ，存在一个分类器。v是一个扰动，v满足：

640?wx_fmt=png

同时，还有一个范数的约束：

640?wx_fmt=jpeg

换句说，需要找到一个对抗扰动v，这个扰动可以加到所有的样本点上，而且会以1−δ的概率让对抗样本被分类错误。

作者提出了一种算法来寻找这种对抗扰动：

640?wx_fmt=png

其中：

640?wx_fmt=png

表示把寻到到的扰动v限制在 640?wx_fmt=jpeg 范数下以ε 为半径的球上。

这个算法的思想是：

从u里面采样出一个样本集 X ,里面有m个图片，然后迭代地寻找能够让m个样本以1−δ概率被分类错误的对抗扰动。

一开始v=0，没有什么扰动，然后对于每个样本 640?wx_fmt=png ，看它加上扰动v后，会不会分类错误，如果分类错误，则下一个样本; 否则寻找一个微小的扰动，使得被分类错误。持续这个过程，直到在这m个样本中错误样本满足错误率。

对抗效果：

基于一个数据集，寻找到的universal 对抗扰动，可以使得新样本也分类错误：

640?wx_fmt=png

其中X是训练集，Val是验证集。

不同模型寻找到universal扰动，也可以使其它模型分类错误，这是模型间的迁移性，注意这里的迁移性与常规的对抗样本的迁移性有一些不同。

640?wx_fmt=png

X 训练集样本量的影响：

640?wx_fmt=png

作者使用的是ImageNet，改数据集有1000类。可以看出当X包含4000个样本时，每个类平均4个样本，攻击成功率可以达到70%左右。而x包含500个样本，平均每个类0.5个样本，对抗成功率也有30%。

Universal pertubations存在性解释：

对于验证集里面的每个样本x，我们寻找它的对抗扰动r(x)=

640?wx_fmt=png

这种r(x) r(x)r(x)其实可以近似看作是分类模型在x xx处的决策界的法向量，因为它很小，只改x的一点点就让分类器得到其它的标签。

作者提取n个样本处的这种法向量，并对它们进行单位化，形成正规矩阵N:

640?wx_fmt=png

通过对N进行SVG分解，作者发现N的奇异值有一些特别大，而另外一些特别小：

640?wx_fmt=png

这种现象意味着，这些法向量其实可以存在冗余的，换句话说这些法向量所在决策界存在着冗余性和相关性。

基于SVG分解的前100 100100个向量张成的对抗扰动，也能取得38%的对抗准确性。这就说明了，神经网络学习得到的决策界，在高维空间是存在相似的相关性的。

通过样本子集X可以获得m个样本的决策界相关性，这种相关性在其它不同的样本周围的决策界上依然存在。

Universal Pertubation则是以最大化成功率的使用这些法向量构建扰动，因而它也会学习到决策界的相关性。

启发与未来工作点

Universal pertubations的存在，使得我们可以通过预训练找好这种通用扰动，然后在实际预测的时候直接把这些扰动加到正常样本上来实施攻击。在这种攻击模式下，攻击者在预测阶段是可以做到实时的，可以不用像传统方法那样花大量的时间针对测试阶段遇到的样本计算对抗扰动。在实时对抗领域，universal pertubation会有很大的空间。

应该也可以使用GAN来产生这种universal pertubation。Generator接受噪声 z ，产生universal pertubations，然后把这种扰动加到所有的正常样本 x 上，使得鉴别器 kˆ(⋅) \hat k(·)

(⋅)（这个鉴别器可以事先训练，GAN训练过程中固定住它）把 x+v x+vx+v识别错，同时在损失函数中加入对 v 的范数约束。

有目标的pertubations.文中提到的方法是无targeted的，只要universal pertubation把原始样本被分类器识别错了就行。这里的targeted可以是：1. 只针对特定的类别做干扰的，例如 universal pertubations可以加到所有图片上，但只会把含有狗的图片这类特殊对象攻击成功。2. Universal pertubations加到所有图片上后，会把所有图片的狗的得分都大化，而不管图片是不是真的有狗。

代码地址：

https://github.com/LTS4/universal

本文转自CSDN博客，转载请联系原作者。扫码查看作者更多文章。

640?wx_fmt=jpeg

（*本文为 AI科技大本营转载文章，请联系原作者）

◆

精彩推荐

◆

2019 中国大数据技术大会（BDTC）再度来袭！豪华主席阵容及百位技术专家齐聚，15 场精选专题技术和行业论坛，超强干货+技术剖析+行业实践立体解读，深入解析热门技术在行业中的实践落地。

即日起，限量 5 折票开售，数量有限，扫码购买，先到先得！

640?wx_fmt=jpeg

推荐阅读

640?wx_fmt=png

你点的每个“在看”，我都认真当成了AI

猜你喜欢

转载自blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/102694152

一文读懂对抗机器学习Universal adversarial perturbations | CSDN博文精选

对抗机器学习——Universal adversarial perturbations

论文阅读 (81)：Fast Feature Fool: A Data Independent Approach to Universal Adversarial Perturbations

一文读懂对抗生成学习(Generative Adversarial Nets)[GAN]

Distillation as a Defense to Adversarial Perturbations against Deep Neural Networks

深度学习在人脸检测中的应用 | CSDN 博文精选

SQL还是那个SQL么？丨CSDN博文精选

实战：人脸识别的Arcface实现 | CSDN博文精选

云原生开发环境初探 | CSDN 博文精选

一文读懂机器学习

关于Spark NLP学习，你需要掌握的LightPipeline（附代码）| CSDN博文精选

如何选择普通索引和唯一索引？｜CSDN博文精选

如何利用 Android 自定义控件实现炫酷的动画？｜CSDN 博文精选

Java String 对象，你真的了解了吗？| CSDN 博文精选

实战：基于tensorflow 的中文语音识别模型 | CSDN博文精选

实战：基于OpenPose的卡通人物可视化 | CSDN博文精选

从 Android 6.0 源码的角度剖析 Binder 工作原理 | CSDN 博文精选

计算机大数乘法引发的思考 | CSDN 博文精选

做好以下四点，拒做 “ 空心 ” 程序员 | CSDN 博文精选

安居客 Android App 走向平台化 | CSDN 博文精选

Rust 入坑指南：鳞次栉比 | CSDN 博文精选

如何提高模型性能？这四大方法值得尝试 | CSDN 博文精选

一文读懂深度学习与机器学习的差异

一文读懂机器学习库graphLab

一文读懂:快速入门机器学习,基础向

CSDN的博文之路的开始

如何转载CSDN博文

CSDN 如何转载博文

CSDN博文写作模板

干货：NIST评测（SRE19）获胜团队声纹识别技术分析 | CSDN博文精选

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)