【论文阅读】MEAL: Multi-Model Ensemble via Adversarial Learning - 代码天地

【论文阅读】MEAL: Multi-Model Ensemble via Adversarial Learning

其他 2019-01-25 00:24:38 阅读次数: 0

本文来自 AAAI 2019, Oral的一篇文章，主要的思想是通过知识蒸馏的方法将不同的已训练的teachers模型，压缩为一个简单的student网络，来学习多种模型的知识而不用产生额外的测试开销。作者使用的是基于对抗的学习策略，设计了一个block-wise training loss引导和优化预先定义的student网络，进行teachers模型知识的蒸馏，并同时提高辨别器网络（discriminator）对学生和老师提取出的特征的区分能力。

【Abstract】

　　性能优异的模型通常包含多个基准网络，然而模型的大小和前馈时间限制了这些模型在实际中的应用，尤其是当拥有较大测试集时。本文提出了基于对抗学习策略的模型压缩方法MEAL，该方法包含三个重要的优势：

　　①学生网络和辨别器一起学习知识能够达到比原始模型更好的优化效果；

　　②通过简单的学生网络实现更快的前馈速度，同时不降低性能；

　　③学生可以学习任意结构网络模型的知识。

【Introduction】

　　该集成方法主要是集合多个网络，将他们在测试阶段的预测通过加权平均或选择进行融合。训练时，将不同或相同的已增强输入经过不同网络结构得到的输出，进行集成预测；测试时，仍然使用一个简单网络；但各个预训练网络使用的监督标签必须和集成中的各个独立网络使用标签一致。

　　传统集成方法的不足：①知识或信息冗余；②集成模型非常大且慢；

　　作者通过不同神经网络的不同输出作为监督来引导目标网络的训练，参考网络成为老师，目标网络成为学生。作者使用soft label以提供更多物体和场景的共生与视觉联系的信息覆盖，来代替传统方法使用的one-hot label

　　

猜你喜欢

转载自www.cnblogs.com/White-xzx/p/10313982.html

【论文阅读】MEAL: Multi-Model Ensemble via Adversarial Learning

【小白笔记】目标跟踪VIVAT(Visual Tracking via Adversarial Learning)论文笔记

Towards Optimal Structured CNN Pruning via Generative Adversarial Learning论文笔记

UnifiedEAE: A Multi-Format Transfer Learning Model for Event Argument Extraction via Variational论文解读

【视频异常检测-论文阅读】Anomaly Detection in Video via Self-Supervised and Multi-Task Learning

论文阅读 (80)：Robust Bag Classification Approach for Multi-instance Learning Via Subspace Fuzzy Clusteri

Ensemble Learning

迁移学习论文阅读：Transfer Learning via Learning to Transfer

论文阅读 Adversarial Complementary Learning forWeakly Supervised Object Localization

阅读论文 GraphGAN: Graph Representation Learning with Generative Adversarial Nets

《GraphGAN：Graph Representation Learning with Generative Adversarial Nets》论文阅读笔记

论文阅读——《Unsupervised Representation Learning With Deep Convolutional Generative Adversarial Networks》

[论文阅读] State-Relabeling Adversarial Active Learning

[论文阅读] Adversarial Learning for Semi-Supervised Semantic Segmentation

[论文阅读] Collaborative and Adversarial Learning of Focused and Dispersive Representation

《learning graph embedding with adversarial training methods》论文阅读

论文学习:Learning to Generate Time-Lapse Videos Using Multi-StageDynamic Generative Adversarial Networks

论文阅读：Deep Metric Learning via Lifted Structured Feature Embedding

Semantic Instance Segmentation via Deep Metric Learning论文阅读

【论文阅读】Graph Few-shot learning via Knowledge Transfer

[论文阅读] Learning a Unified Classifier Incrementally via Rebalancing

[论文阅读] Active Learning for Deep Object Detection via Probabilistic Modeling

论文笔记：Generative Adversarial Imitation Learning

集成算法（ensemble learning）--竞赛和论文神器

Deep Learning Based Registration文章阅读(二)《Unsupervised Multi-Modal Image Registration via Geometry Pre

CVPR2018读文笔记：VITAL：VIsual Tracking via Adversarial Learning

【IQA】Hallucinated-IQA: No-Reference Image Quality Assessment via Adversarial Learning

【论文解读】Multi-View 3D Shape Recognition via Correspondence-Aware Deep Learning

集成学习（ensemble Learning）

Ensemble Learning and Random Forests

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)