深度学习模型网络学习之移动网络

其他 2018-06-25 19:10:40 阅读次数: 2

1. SquezeeNet

论文地址：
SQUEEZENET: ALEXNET-LEVEL ACCURACY WITH 50X FEWER PARAMETERS AND <0.5MB MODEL SIZE

1.1 论文导读

小型网络模型的优点：

有利于分布式训练，减少数据交换量
模型变小，对客户端的更新更便捷
更容易在FPGA上进行部署

相关工作：

模型压缩：SVD，Network Pruning，quantization，huffman encoding
CNN 微架构：LeCun（5x5）,VGG(3x3),NIN(1X1),Inception module,ResNet Module
CNN宏观架构：Deeper（VGG），ResNet，bypass connections

三条设计准则

将3x3的filters替换成1x1
减少3x3滤波器的输入通道数
延迟和减少下采样以获得更多激活map，即网络前期尽量使stride为1

SquezeeNet

这里写图片描述
如上图所示，Fire module分为两个模块，squeeze模块由S1x1个1x1大小的滤波器组成，呼应设计准则1，expand层由e1x1个1x1大小的滤波器和e3x3个3x3大小的滤波器构成，同时保证S1x1 < e1x1+e3x3，呼应设计准则2。

这里写图片描述
具体网络设计如上图（左边的模型），模型间很少采用pooling层，呼应设计准则3
在fire9之后有dropout为0.5，补零padding为1，初始学习率为0.04

SquezeeNet的压缩

使用韩松的Deep Compression 算法，采用6-bit的参数量化和33%的稀疏，最终模型大小为0.47MB (510×
smaller than 32-bit AlexNet)，并且算法准确度并没有损失。

SquezeeNet宏观模型调优

如figure2所示，有三种模型，普通SquezeeNet,加入简单的bypass的SquezeeNet，加入复杂的bypass的SquezeeNet，简单的bypass是将值进行直接相加，并没有增加通道数，而复杂的bypass则通过加入若干个1x1的卷积核实现通道数的增加，增加了信息量，在一定程度上可以弥补S1x1模块造成的信息减少，但是结果证明，简单的bypass的SquezeeNet反而效果最好，这一点作者估计也是懵逼吧!

SquezeeNet微观模型调优

超参数SR（S1x1/(e1x1+e3x3)）, pct (e3x3/(e1x1+e3x3) , base_e为第一个fire module的 $e_i$ 数值
这里写图片描述
最终实验选择：
$base_e$ = 128, $incr_e$ = 128, pct = 0.5, freq = 2, and SR = 0.125

2. MobileNet

2.1 论文导读

deepwise分离卷积层

将传统的卷积层N个DxDxM分解为两个卷积：M个DxDx1，N个1x1xM,减少了参数量，并减少了八到九倍的计算量！
这里写图片描述

网络架构

每个deepwise分离卷积层间都有relu和BN计算
这里写图片描述

Width Multiplier : 更瘦的网络

定义一个超参数卷积宽度乘法因子a,参数取值为0.25，0.5，0.75，1，减少卷积的个数,这样做能减少 $a^2$ 的参数量与计算量：
这里写图片描述

Resolution Multiplier : 通过缩小图片减少特征

定义一个超参数分辨率乘法因子p，p取值为0～1，具体输入图像分辨率为128，160，192，224。
这里写图片描述

Fine Grained Recognition：

**训练技巧：
1. 用噪声较大的大数据库进行pretrain，然后用精确的小数据库进行finetune！
2. 利用较大规模精确度较高的模型网络的结果数据进行训练，这样的好处在于数据量可以无限大，且训练时不太需要考虑正则化！

猜你喜欢

转载自blog.csdn.net/u012554092/article/details/79835262

深度学习模型网络学习之移动网络

小白带你学习移动网络深度神经网络

移动网络MSS

无线与移动网络

移动网络整理

深度学习----CNN模型学习之ResNet（残差）网络

深度学习预报模型：深度信念网络

深度学习之卷积神经网络经典模型

机器学习-深度学习的经典网络模型

判断网络状态 Wifi 移动网络

[趣谈网络协议学习] 23 移动网络：去巴塞罗那，手机也上不了脸书

深度学习之卷积网络

深度学习之resnet网络

深度学习之GRU网络

深度学习网络模型的改进与调整

神经网络与深度学习模型

判断网络状态 ,移动网 ,wife

家用网络联网----移动网

移动网络的基本原理

android6.0设置-移动网络

深度学习（3）之经典神经网络模型整理：神经网络、CNN、RNN、LSTM

转电信增值业务学习笔记2--移动网络基本概念和组网结构

细节决定成败！美团点评APP在移动网络性能优化的实践，进阶学习资料！

android之网络状态判断（wifi和移动网络数据）

android之网络状态判断（wifi和移动网络数据）

【重磅】移动网络性能揭秘（上）--移动网络组件详解

网络深度对深度学习模型性能有什么影响？

深度学习卷积神经网络CNN之GoogLeNet模型网络模型详解说明（超详细理论篇）

深度学习之循环神经网络

深度学习之各种网络结构

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

SVN同步出现问题

解决 nginx 出现 413 Request Entity Too Large 的问题

第一节区块链服务BaaS的总体架构以及基本模块设计的一种方案

ITeye 2013年度盘点——社区赠书书单

IDEA / git 和github 的新手使用教程史上最简单的 IntelliJ IDEA 教程史上最简单的 GitHub 教程

测试工程方法：测试用例设计综合策略

Spark优化(三)：对多次使用的RDD进行持久化

使用STM32 ST-LINK Utility 设置读保护后不能运行

exgcd 解同余方程ax=b(%n)

Android使用脚本进行多渠道打包

每日归档

更多

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)