深度学习_深度学习基础知识_Internal Covariate Shift - 代码天地

深度学习_深度学习基础知识_Internal Covariate Shift

其他 2020-01-16 16:29:18 阅读次数: 0

深度神经网络模型的训练为什么会很困难？其中一个重要的原因是深度神经网络涉及到很多层的叠加，而每一层的参数更新导致上层的输入数据分布发生变化，通过层层叠加，高层的输入分布变化会非常剧烈，这就使得高层需要不断去重新适应底层的参数更新。为了训练好模型，我们需要非常谨慎地去设定学习率、初始化权重以及尽可能细致的参数更新策略。

Google将这一现象总结为Internal Covariate Shift，简称ICS。

我们知道在统计机器学习中的一个经典假设是“源空间（source domain）和目标空间（target domain）的数据分布（distribution）是一致的”。如果不一致，那么就会出现新的机器学习问题，如transfer learning和domain adaptation等。而Covariate Shift就是分布不一致假设之下的一个分支问题，它是指源空间和目标空间的条件概率是一致的，但是其边缘概率不同。

对于神经网络的各层输出，由于它们经过了层内操作作用，其分布显然与各层对应的输入信号分布不同，而且差异会随着网络深度增大而增大，可是它们所能“指示”的样本标记（label）仍然是不变的，这便符合了Covariate Shift的定义。由于是对层间信号的分析，所以这就是“Internal”的由来。

ICS导致的问题：

首先使得每个神经元的输入数据不再是“独立同分布”。

上层参数需要不断适应新的输入数据分布，降低学习速率。
下层输入的变化可能趋向于变大或者变小，导致上层落入饱和区，使得学习过早停止。
每层的参数更新都会影响到其他层，因此每层的参数更新策略需要尽可能的谨慎。

发布了95 篇原创文章 · 获赞 37 · 访问量 3422

私信关注

猜你喜欢

转载自blog.csdn.net/Rocky6688/article/details/103797650

深度学习_深度学习基础知识_Internal Covariate Shift

[转] Covariate shift && Internal covariate shift

Internal Covariate Shift以及Batch Normalization

Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

Internal Covariate Shift(ICS)的理解和 Batch Normalizaton的原理及优点

Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shift

Batch Normalization： Accelerating Deep Network Training by Reducing Internal Covariate Shift

论文学习：Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

【论文学习】Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 论文笔记

Batch Normalization Accelerating Deep Network Training by Reducing Internal Covariate Shift 阅读笔记与实现

Batch Normalization：Accelerating Deep Network Training by Reducing Internal Covariate Shift 论文笔记

论文笔记：Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》笔记

《Batch Normalization Accelerating Deep Network Training by Reducing Internal Covariate Shift》阅读笔记与实现

论文阅读 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》论文笔记

[论文阅读] Batch Normalization: Accelerating Deep Network Training By Reducing Internal Covariate Shift

Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift全文翻译

批归一化Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift论文详解

批标准化详解（Batch Normalization for Reducing Internal Covariate Shift）

BN——Batch Normalization：Accelerating Deep Network Training by Reducing Internal Covariate Shift

Accelerating Deep Network Training by Reducing Internal Covariate Shift-BN归一化解读

covariate shift现象以及解决方法

covariate shift和batch normalization问题

图像分类（二）GoogLenet Inception_v2：Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

深度学习中的Internal Convariate Shift (ICS)

shift

MPI_Cart_shift 的学习

data shift--学习笔记

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)