sp4.2 Deep convolutional models：case studies - 代码天地

sp4.2 Deep convolutional models：case studies

其他 2018-11-15 18:34:38 阅读次数: 0

一些经典CNN方面网络: LeNet-5 AlexNet VGG

LeNet-5：90年代当时使用的更多的是平均池化不用padding 大概6万个参数

这个模型里面通道数量（第三维）在逐渐增加越来越长了高和宽越来越小了

这里多个卷积后面跟个池化这个现在还用当时池化后进行了sigmoid函数现在不用

当时用的sigmoid或tanh

精读第二段泛读第三段

AlexNet：和上一个很相似，但是大很多参数6000W个

用了relu激活函数这个当时用了GPU虽然比较慢

还用局部响应归一层LRN层相当于从13*13*256里取一条归一化现在并不重要

VGG-16：简化了模型专注于卷积层

1.38亿个参数很规整这个模型非常深信道通道不断增加到512

卷积 64个3*3的过滤器 --pool---卷积--pool--。。。---FC-FC-SOFTMAX

http://blog.csdn.net/buyi_shizi/article/details/53336192

残差网络：ResNet inception

很深的难训练存在梯度消失梯度爆炸运用跳远连接skip connections

ResNet：残差块构成

残差块： a^l到a^l+2一般情况下要经过a+--线性--relu--al+1--线性--relu--al+2

现在直接复制到最后让AL+2前加个Al

identity block这种块是直接传过去

这种块如果输入和后面的维数不匹配的话

他是做完卷积再正则化传过去

每两个构成一个残差块传统的误差会先减少再增加而这个残差代价就越来越小

残差为什么有用：即使给神经网络多加两层容易学习恒等函数仍然保持简单时候的效率

在正则化或权重衰减时候也许当前项都0了还可以保持前面的al

这样他也不逊色于上面简单的网络了

他用了很多相同的卷积 zl+2 al具有相同维度

1*1卷积层池化层只压缩了宽和高这个也可以压缩通道数也可以增加通道数

对一维的一个平面没什么效果相当于一个数字而已

但是多通道的就不一样了这分别对应一乘相当于全连接神经网络了啊

用于压缩第三维n_C 这里通道数为192吧用32个1*1的就压缩为32层

inception盗梦空间利用上面的1*1卷积：

相当于你把他都列出来他自己学

保持相同维度通道可以不同也可以用池化层但也需要维度不变

让他自己学习用哪个过滤器组合

对于5*5的过滤器计算： 32个过滤器每个为5*5*192

计算成本：

所以一共28*28（原图维数）*32个过滤器* 5*5*192过滤器维度=1.2亿次计算

这里计算量比较大现在就用到了1*1卷几层

只要合理的构建瓶颈层不会影响性能

利用1*1*192 维16个的话：压缩了一下 28*28*16

16*28*28*192*1*1=240万个 28*28*32*5*5*16=1000万个 1240万次比之前的降了10倍

有些块还有分支通过隐藏层做出预测类似最后一层softmax输出结果防止过拟合

运用开放的源码：直接复现别人论文非常难直接github 找原作者的开源

一般工作流程：选一个喜欢的模型然后找到他的开源下载下来进行修改

迁移学习：还是用别人训练好的去掉后面几层前面的不用动把他当做一个初始化的原型

只有少数训练集就保留人家大多数层前面的都冻住那些参数不变之变自己后面加的如果自己训练集很大可以保留部分

如果训练集特别大把他们当做随机初始化后的值在此基础上继续训练

数据扩充：计算机视觉方面数据越多的确是效果越好

镜像对称随机裁剪扭曲变换局部弯曲等

色彩转换，加滤镜或rgb加加减减对RGB的改变可以用PCA 有alexnet paper PCA color augmention

如果有大量数据：利用cpu多线程对有的图片变形啊变色啊

计算机视觉现状：现状语音数据很多图像数据还不够物体检测的更少（有标注框的）

少数据就需要人工调参啊各种技巧迁移学习多数据就是手工的少一点更大的神经网络就可以

Use open source code：

Use architectures of networks published in the literature

Use open source implementations if possible

Use pretrained models and fine-tune on your dataset

猜你喜欢

转载自www.cnblogs.com/hellodantong/p/9965250.html

sp4.2 Deep convolutional models：case studies

015 Deep convolutional models:case studies

Convolutional Neural Networks（week 2）——Deep convolutional models: case studies

DeepLearning.ai作业:(4-2)-- 深度卷积网络实例探究（Deep convolutional models:case studies）

DeepLearning.ai笔记:(4-2)-- 深度卷积网络实例探究（Deep convolutional models:case studies）

吴恩达deeplearning.ai系列课程笔记+编程作业(11)第四课卷积神经网络-第二周深度卷积网络：实例探究（Deep convolutional models: case studies）

deeplearning.ai 笔记 Specialization 4 week 2 Convolutional Neural Networks Case Studies

ML Case Studies(0)

Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps

deep learning 吴恩达 -- 第四课第二周测验 Deep convolutional models

论文笔记《The application of two-level attention models in deep convolutional neural network for FGVC》

importing-cleaning-data-in-r-case-studies

【学习笔记】Week2_Case studies_Why look at case studies?

【学习笔记】Week2_Case studies_Classic Networks

【学习笔记】Week2_Case studies_ResNets

论文阅读- Uncovering Coordinated Networks on Social Media:Methods and Case Studies

ImageNet Classification with Deep Convolutional Neural Networks

《ImageNet Classification with Deep Convolutional Neural Network》

ImageNet Classification with Deep Convolutional Neural Networks 译文

Deep Convolutional Network Cascade for Facial Point Detection

AlexNet《ImageNet Classification with Deep Convolutional Neural Networks》

ImageNet Classiﬁcation with Deep Convolutional Neural Networks

Very Deep Convolutional Networks for Text Classification

ImageNet Classification with Deep Convolutional Neural Networks(AlexNet)

DCGANs (Deep Convolutional Generative Adversarial Networks)

AlexNet——ImageNet Classification with Deep Convolutional Neural Networks

「Deep Learning」Note on Graph Convolutional Networks

读ImageNet Classification with Deep Convolutional Neural Networks

A Survey of the Recent Architectures of Deep Convolutional Neural Networks

A Taxonomy of Deep Convolutional Neural Nets for Computer Vision

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)