DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS - 代码天地

DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS

其他 2020-05-28 15:38:19 阅读次数: 0

概
主要内容

Samangouei P, Kabkab M, Chellappa R, et al. Defense-GAN: Protecting Classifiers Against Adversarial Attacks Using Generative Models.[J]. arXiv: Computer Vision and Pattern Recognition, 2018.

@article{samangouei2018defense-gan:,
title={Defense-GAN: Protecting Classifiers Against Adversarial Attacks Using Generative Models.},
author={Samangouei, Pouya and Kabkab, Maya and Chellappa, Rama},
journal={arXiv: Computer Vision and Pattern Recognition},
year={2018}}

概

本文介绍了一种针对对抗样本的defense方法, 主要是利用GAN训练的生成器, 将样本\(x\)投影到干净数据集上\(\hat{x}\).

主要内容

我们知道, GAN的损失函数到达最优时, \(p_{data}=p_G\), 又倘若对抗样本的分布是脱离于\(p_{data}\)的, 则如果我们能将\(x\)投影到真实数据的分布\(p_{data}\)(如果最优也就是\(p_G\)), 则我们不就能找到一个防御方法了吗?

对于每一个样本, 首先初始化\(R\)个随机种子\(z_0^{(1)}, \ldots, z_0^{(R)}\), 对每一个种子, 利用梯度下降(\(L\)步)以求最小化

\[\tag{DGAN} \min \quad \|G(z)-x\|_2^2, \]

其中\(G(z)\)为利用训练样本训练的生成器.

得到\(R\)个点\(z_*^{(1)},\ldots, z_*^{(R)}\), 设使得(DGAN)最小的为\(z^*\), 以及\(\hat{x} = G(z^*)\), 则\(\hat{x}\)就是我们要的, 样本\(x\)在普通样本数据中的投影. 将\(\hat{x}\)喂入网络, 判断其类别.

在这里插入图片描述

在这里插入图片描述

另外, 作者还在实验中说明, 可以直接用\(\|G(z^*)-x\|_2^2 \frac{<}{>} \theta\) 来判断是否是对抗样本, 并计算AUC指标, 结果不错.

注: 这个方法, 利用梯度方法更新的难处在于, \(x \rightarrow \hat{x}\)这一过程, 包含了\(L\)步的内循环, 如果直接反向传梯度会造成梯度爆炸或者消失.

猜你喜欢

转载自www.cnblogs.com/MTandHJ/p/12981134.html

DEFENSE-GAN: PROTECTING CLASSIFIERS AGAINST ADVERSARIAL ATTACKS USING GENERATIVE MODELS

LOGAN：Membership Inference Attacks Against Generative Models

LAPGAN：Deep Generative/Image Models using a Laplacian Pyramid of Adversarial Networks 使用拉普拉斯金字塔的GAN

【论文阅读】SABRE: Protecting Bitcoin against Routing Attacks

GAN——Generative Adversarial Nets

GAN (Generative Adversarial Network)

GAN: Generative Adversarial Nets

Generative Adversarial Nets (GAN)

GAN(Generative Adversarial Network)

GAN —— 《Generative Adversarial Nets》

Understanding Generative Adversarial Networks (GAN)

GAN网络(Generative Adversarial Nets)

Generative Adversarial Nets[Wasserstein GAN]

Speech Bandwidth Extension Using Generative Adversarial Networks

Photo Enhancer Using Generative Adversarial Networks

Enhancing Underwater Imagery using Generative Adversarial Networks

【HGNN】AAAI 2022 RoHe Robust Heterogeneous Graph Neural Networks against Adversarial Attacks

Distillation as a Defense to Adversarial Perturbations against Deep Neural Networks

Generative Adversarial Network (GAN) papers (2018.2.4 更新）

Generative Adversarial Nets (GAN) 阅读笔记

Generative Adversarial nets（GAN）学习笔记

GAN开山之作: Generative Adversarial Networks

GAN（Generative Adversarial Network）的学习历程

GAN---Conditional Generative Adversarial Nets论文

论文解析：Membership Inference Attacks Against Machine Learning Models（一看即懂）

Deep Generative Model2--GAN(Generative Adversarial Network)-cont

Deep Generative Model2--GAN(Generative Adversarial Network)

《Ensemble Generative Cleaning with Feedback Loops for Defending Adversarial Attacks》论文笔记

Unsupervised Learning Using Generative Adversarial Training And Clustering 翻译

《GAIN Missing Data Imputation using Generative Adversarial Nets》探析

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)