【深度学习】GoogLeNet系列解读 —— Inception v3 - 代码天地

【深度学习】GoogLeNet系列解读 —— Inception v3

其他 2018-11-16 19:42:41 阅读次数: 0

版权声明：本文为博主原创文章，请尊重原创，转载请注明原文地址和作者信息！ https://blog.csdn.net/zzc15806/article/details/83474661

目录

GoogLeNet系列解读

Inception v3

Inception v3整体上采用了Inception v2的网络结构，并在优化算法、正则化等方面做了改进，总结如下：

1. 优化算法使用RMSProp替代SGD。

2. 使用Label Smoothing Regularization（LSR）方法。LSR是一种通过在输出y中加噪声，实现对模型进行约束，降低模型过拟合的方法。进行模型训练时，通常真是标签q(k/x)采用one-hot的形式，而模型的输出一般为softmax归一后的概率分布p(k/x)，

$p(k/x)=\frac{exp(z_k)}{\sum_i^{i=K}exp(z_i))}$

损失函数为，

$H(q,p)=- \sum_{k=1}^{K}log({p(k)q(k)})$

训练的目的是使p(k/x)的分布尽可能接近q(k/x)，但是这种方法很容易产生过拟合。举个例子，假设分类器需要区分“我们都喜欢玩耍”和“我们都喜欢学习”两句话。假设“玩耍”出现80次，“学习”出现20次，因为标签采用one-hot的形式，随着次数的增加，模型会逐渐倾向于“玩耍”这句话的搭配，使这个搭配的预测概率逐渐趋向于100%，而“学习”这个搭配会逐渐被忽略。

为了解决这个问题，作者以权重加入某一概率分布到原始标签中构成新的标签，形式如下：

$q'(y/x)=(1-\alpha )q(y/x)+\alpha u(y)$

其中， $\alpha \in [0,1]$ 。论文中作者使用了均匀分布，

$q'(y/x)=(1-\alpha )q(y/x)+\frac{\alpha}{K}$

这种方式可以防止把模型预测值过分集中在给率较大的类别上，会对小概率类别增加更多的关注。

此时，损失函数变为，

$H(q',p)=- \sum_{k=1}^{K}log({p(k)q'(k)})=( 1-\alpha )H(q,p)+\alpha H(u,p)$

从损失函数可以看出，LSR相当于使用了两个loss。当u服从均匀分布时，H(u,p)为常数，能够衡量预测分布p和均匀分布的不相似程度，起到了正则化的作用。

3. 将第一个7x7卷积层分解为两个3x3卷积层。

4. 辅助分类器（auxiliary classifier）的全连接层也进行了batch-normalization操作。

Inception v3相比于Inception v2有了较大的提升，实验结果如下：

猜你喜欢

转载自blog.csdn.net/zzc15806/article/details/83474661

【深度学习】GoogLeNet系列解读 —— Inception v3

【深度学习】GoogLeNet系列解读 —— Inception v1

【深度学习】GoogLeNet系列解读 —— Inception v4

【深度学习】GoogLeNet系列解读 —— Inception v2

从GoogLeNet至Inception v3

Paper Reading: Inception系列之Inception v3

白话超级详细解读(一)-----GoogLeNet（Inception V1-Inception V3）

深度学习面试题29：GoogLeNet(Inception V3)

深度学习网络篇——Inception v3

Inception V3

GoogLeNet 改进之 Inception-v2/v3 解读

Inception V3论文解读和代码解析

网络结构解读之inception系列四：Inception V3

Inception结构和Inception V1, V2, V3学习

Rethinking the Inception Architecture for Computer Vision-Inception v2 v3详细解读

含并行连结的网络 GoogLeNet / Inception V3 动手学深度学习v2 pytorch

花种类预测-迁移学习（Inception V3）

GoogLeNet 之 Inception v1 v2 v3 v4

GoogLeNet(inception-v1,v2,v3,v4)阅读笔记

深度解读GoogleNet之Inception V1

详解深度学习之经典网络架构（五）：GoogLeNet 四代(Inception v1、v2、v3、v4)

网络结构解读之inception系列二：GoogLeNet（Inception V1）网络结构解读之inception系列二：GoogLeNet（Inception V1）

【Tensorflow】深度学习实战05——Tensorflow实现Inception V3

Keras深度学习实战——基于Inception v3实现性别分类

Keras深度学习——基于Inception v3实现性别分类

【深度学习】Inception模型结构解析，关键词：Inception-v1、v2、v3、v4、Inception-ResNet-v1、Inception-ResNet-v2

GoogLeNet 之 Inception-v1 解读

深度学习之GoogLeNet (Inception v4 & Inception-ResNet-v2)

Google-Net系列(Inception v1、v2、v3、v4)

【TensorFlow系列】【五】利用inception v3 pb模型文件做预测

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)