VGGNet论文学习记录：VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION - 代码天地

VGGNet论文学习记录：VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

其他 2018-06-22 06:09:56 阅读次数: 3

按照Andrew Ng推荐的顺序，精读了第二篇深度学习的经典论文，下面记录一些文章中的关键点。

以VGG16为例，输入是224x224x3的图像，下面是每一层的大小：

conv1_1 [32, 224, 224, 64]

conv1_2 [32, 224, 224, 64]

pool1 [32, 112, 112, 64]

conv2_1 [32, 112, 112, 128]

conv2_2 [32, 112, 112, 128]

pool2 [32, 56, 56, 128]

conv3_1 [32, 56, 56, 256]

conv3_2 [32, 56, 56, 256]

conv3_3 [32, 56, 56, 256]

pool3 [32, 28, 28, 256]

conv4_1 [32, 28, 28, 512]

conv4_2 [32, 28, 28, 512]

conv4_3 [32, 28, 28, 512]

pool4 [32, 14, 14, 512]

conv5_1 [32, 14, 14, 512]

conv5_2 [32, 14, 14, 512]

conv5_3 [32, 14, 14, 512]

pool5 [32, 7, 7, 512]

fc6 [32, 4096]

fc7 [32, 4096]

fc8 [32, 1000]

有一些关键点：

1x1的卷积的主要作用是线性变换。
VGGNet中多个完全一样的3x3的卷积层堆叠，可以产生和大卷积核一样的效果但是参数量更少，但是却有更多的非线性变换，所以学习能力更强。
使用Mutlti-Scale的方法做数据增强，防止过拟合。
在预测时使用滑动窗口，并且取多尺度上的平均值作为最终预测值。

下面算一下参数数量：

输入：224*224*3

第一组：

conv3 - 64（卷积核的数量）：kernel size:3 stride:1 pad:1

参数：（3*3*3）*64 =1728

conv3 - 64：kernel size:3 stride:1 pad:1

参数：（3*3*64）*64 =36864

pool2 kernel size:2 stride:2 pad:0

参数： 0

第二组：

conv3-128:kernel size:3 stride:1 pad:1

参数：（3*3*64）*128 =73728

conv3-128:kernel size:3 stride:1 pad:1

参数：（3*3*128）*128 =147456

pool2: kernel size:2 stride:2 pad:0

参数：0

第三组：

conv3-256: kernel size:3 stride:1 pad:1

参数：（3*3*128）*256=294912

conv3-256: kernel size:3 stride:1 pad:1

参数：（3*3*256）*256=589824

conv3-256: kernel size:3 stride:1 pad:1

参数：（3*3*256）*256=589824

pool2: kernel size:2 stride:2 pad:0

参数：0

第四组：

conv3-512:kernel size:3 stride:1 pad:1

参数：（3*3*256）*512 = 1179648

conv3-512:kernel size:3 stride:1 pad:1

参数：（3*3*512）*512 = 2359296

conv3-512:kernel size:3 stride:1 pad:1

参数：（3*3*512）*512 = 2359296

pool2: kernel size:2 stride:2 pad:0

参数： 0

第五组：

conv3-512:kernel size:3 stride:1 pad:1

参数：（3*3*512）*512 = 2359296

conv3-512:kernel size:3 stride:1 pad:1

参数：（3*3*512）*512 = 2359296

conv3-512:kernel size:3 stride:1 pad:1

参数：（3*3*512）*512 = 2359296

pool2:kernel size:2 stride:2 pad:0

参数：0

第六组：

FC: 4096 neurons

参数：7*7*512*4096 = 102760448

FC: 4096 neurons

参数：4096*4096 = 16777216

FC：1000 neurons

参数：4096*1000=4096000

猜你喜欢

转载自blog.csdn.net/heiheiya/article/details/80678854

VGGNet论文学习记录：VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

Very Deep Convolutional Networks For Large-Scale Image Recognition(VGGnet)

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

VGG: Very Deep Convolutional Networks for Large-Scale Image Recognition

VGG —— Very Deep Convolutional Networks for Large-Scale Image Recognition

VGG：VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

论文学习：（VGG）Very Deep Convolutional Networks for Large-scale Image Recognition

VGGNet论文（Very Deep Convolutional Networks for Large-Scale Image Recognition）（译）

论文理解 - VGGNet - Very Deep Convolutional Networks for Large-Scale Image Recognition

VGGNet论文翻译-Very Deep Convolutional Networks for Large-Scale Image Recognition

[深度学习] Very Deep Convolutional Networks for Large-Scale Image Recognition（VGGNet）阅读笔记

VGGNet - VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION全文翻译

Very Deep Convolutional Networks for Large-Scale Image Recognition-VGGNet解读

论文阅读笔记--VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

论文笔记《Very Deep Convolutional Networks for Large-Scale Image Recognition》

论文解读| Very Deep Convolutional Networks for Large-Scale Image Recognition

经典论文阅读《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》简短阅读笔记

Very Deep Convolutional Networks for Large-Scale Image Recognition—VGG论文翻译

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION论文翻译

2014-VGG-《Very deep convolutional networks for large-scale image recognition》翻译

VGG-《Very deep convolutional networks for large-scale image recognition》翻译

VGG-net《Very Deep Convolutional Networks for Large-Scale Image Recognition》

阅读笔记：Very Deep Convolutional Networks for Large-Scale Image Recognition

VGG Net--《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》阅读翻译

Very Deep Convolutional Networks for Large-Scale Image Recognition（VGG）笔记

VGG：VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION译文

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION-2014

(VGG)Very Deep Convolutional Networks for Large-Scale Image Recognition阅读笔记

Backbone-VGG[ICLR2015] Very Deep Convolutional Networks for Large-Scale Image Recognition

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNTION（翻译）

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)