【论文阅读】Gradient Centralization: A New Optimization Technique for Deep Neural Networks

企业开发 2020-04-13 11:01:17 阅读次数: 0

香港理工&阿里达摩院新作，操作优雅，一行代码嵌入优化器提升性能！

ArXiv 链接：https://arxiv.org/abs/2004.01461

Github 链接：https://github.com/Yonghongwei/Gradient-Centralization

一、摘要

优化技术对有效地训练深度神经网络 (DNN) 而言具有重要意义。结果表明，利用一阶和二阶统计量 (如均值和方差) 对网络激活或权重向量 (如批标准化 (BN) 和权重标准化 (WS) ) 进行 Z-score 标准化可以提高训练性能。不同于现有的方法，本文提出了一种新的优化技术，即梯度中心化 (GC) ，它通过将梯度向量中心化为零均值，实现对梯度的直接优化。GC 可视为一种有约束损失函数的投影梯度下降法。研究结果表明，GC 能同时调整 (regularize) 权值空间和输出特征空间，提高 DNNs 的泛化性能。此外，GC 改善了损失函数的 Lipschitzness 性 (连续性?) 及其梯度，使训练过程变得更有效和稳定。GC 的实现非常简单，只需一行代码即可轻松地嵌入到现有的基于梯度的 DNN 优化器中 (如 Adam-GC、SGD-GC 等)。它也可以直接用于微调预训练 DNN。在通用图像分类、细粒度图像分类、检测和分割等应用中的实验表明，GC 能持续提升 DNN 学习性能。

二、实现

结构：

算法：

__百代过客__

发布了14 篇原创文章 · 获赞 12 · 访问量 717

私信关注

猜你喜欢

转载自blog.csdn.net/qq_39478403/article/details/105474593

【论文阅读】Gradient Centralization: A New Optimization Technique for Deep Neural Networks

Gradient Centralization: A New Optimization Technique for Deep Neural Networks

Improving Deep Neural Networks (Week2)---Optimization algorithms

【论文阅读笔记】---《A Survey of Model Compression and Acceleration for Deep Neural Networks》

【论文阅读笔记】Deep Neural Networks for Object Detection

【论文阅读】Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffma

《2017-Aggregated Residual Transformations for Deep Neural Networks》论文阅读

【论文阅读】Clustering Convolutional Kernels to Compress Deep Neural Networks

【论文阅读】Aggregated Residual Transformations for Deep Neural Networks Saining（ResNext）

论文阅读：Learning Compact Binary Descriptors with Unsupervised Deep Neural Networks

论文阅读之《DeepIlluminance: Contextual IlluminanceEstimation via Deep Neural Networks》

读论文：Deep Neural Networks with Multitask Learning

Improving Deep Neural Networks

Neural Networks and Deep Learning

Efficient Deep Neural Networks

Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization（第二周作业）

吴恩达深度学习2.2练习_Improving Deep Neural Networks_Optimization

第二课:Improving Deep Neural Networks 第二周：编程作业:Optimization Methods

[C4] Andrew Ng - Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization

AMiner推荐论文：SMU: smooth activation function for deep networks using smoothing maximum technique

【阅读笔记】Training Deep Neural Networks on Imbalanced Data Sets

Flower classification using deep convolutional neural networks 阅读笔记

Neural networks and deep learning阅读笔记（2）后向传播算法

《FRACTALNET: ULTRA-DEEP NEURAL NETWORKS WITHOUT RESIDUALS》阅读笔记

AlexNet论文(ImageNet Classification with Deep Convolutional Neural Networks)(译)

Understanding Neural Networks Through Deep Visualization 论文笔记

【论文】AlexNet-ImageNet Classification with Deep Convolutional Neural Networks

How transferable are features in deep neural networks? 论文笔记

Channel Pruning for Accelerating Very Deep Neural Networks 论文笔记

论文翻译——Scalable Object Detection using Deep Neural Networks

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)