基础网络架构探究之DiracNets - 代码天地

基础网络架构探究之DiracNets

其他 2018-10-31 06:51:14 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/linolzhang/article/details/79721762

CNN研究者总是面临一个共同的话题：如何提升神经网络的表达能力？

分两个方向去探讨：

1）拉长

增加网络层数是最直观的一种方法，但这种方法所面临的是梯度消失问题，网络越深，梯度的回传越困难。

基于此，MSRA提出了ResNet，通过skipconnection的方式，通过残差思想很好的解决了这个问题。

可以参考论文：Deep Residual Learning forImage Recognition

这一版本的 ResNet存在一个问题，作者也open了出来，并且很快提出了解决方案：

Identity Mappings in DeepResidual Networks

去掉了最外面的relu层，实现了Identity mapping，在1001层的网络上表现相当强悍（感叹一下，把一篇文章能解决的问题凑两次，大神也套路）

2）变宽

变宽的思路包括很多种，主要做法就是拆分卷积层，每层通过不同的卷积核来引入提取的多样性，通过concat或者其他joint方式来合并，比如Inception、ResNext等。

3）结构优化

结构优化的方向比较多，比如常用的方法：

A）修改激活函数

包括PReLU、LReLU、CReLU、ELU、SELU等

B）定义卷积核

比如1*3的卷积核，膨胀卷积，不规则卷积等；

C）Batch Normalization（BN）和Layer Normalization（LN）、多尺度

D）Weight Normalization

即通过重写权值w来加速深度网络的参数收敛

A Simple Reparameterizationto Accelerate Training of Deep Neural Networks

4）轻量级网络

通过Pruning、量化等方法来压缩网络，在相同计算量的情况下，构造最优的网络。

l DiracNets

本文提出的DiracNet，是属于 Weight Normalization 的一种，先来认识一下dirac函数：

Dirac函数比较简单，公式描述为：

即在x=0点值为1，其它值为0，定义区间上积分为1，示意图：

其中卷积函数定义为（x为input，I为单位矩阵）：

不考虑bias的情况：

a，b都是通过训练得到，其中a初始化为1.0，b初始化为0.1，

对于每一个滤波器（Filter），W是按照欧式距离归一化后得到的权重向量。

猜你喜欢

转载自blog.csdn.net/linolzhang/article/details/79721762

基础网络架构探究之DiracNets

Hadoop基础架构探究

4 --＞网络驱动架构基础之 — Linux 网络栈剖析

网络编程探究总结之TCP/IP

Zookeeper探究之基础知识总结

（二）C++基础之引用的探究

5 ~~＞网络驱动架构基础之 — Netfilter 浅析

MVC架构探究及其源码实现(1)-理论基础

网络编程-之-架构

MySQL之基础架构

1 ~~＞＞网络驱动架构基础之 — 网络设备驱动基本框架

2 ~~ ＞＞网络驱动架构基础之 — Linux网络包接收过程

3 --＞网络驱动架构基础之 — linux内核网络分层结构

安卓学习笔记之-网络世界的探究

【网络基础】企业网络架构

【Android】网络架构之 Retrofit

一、CNNs网络架构-基础网络架构（LeNet、AlexNet、ZFNet）

网络模型探究

网络编程-之-网络基础

网络基础之网络协议

网络基础之网络模型

网络基础之----网络协议

网络基础之网络布线

死磕安卓前序：MVP架构探究之旅—基础篇

网络基础之HTTP

前端基础之网络

网络基础之socket

基础网络之EfficientNet

网络基础之TLS

Java架构之jms基础

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)