深度学习--解决梯度爆炸方法（含TensorFlow代码） - 代码天地

深度学习--解决梯度爆炸方法（含TensorFlow代码）

其他 2018-06-23 22:20:25 阅读次数: 2

在深层的神经网络中，经常碰到梯度消失或者梯度爆炸问题。我先讲一下原理，在求导的时候因为是链式法则，哪怕所有层的导数都很接近1，比如0.9，那么在20层之后0.9的20次方也只剩0.1左右。这就意味着越深层的误差难以影响到浅层的权重。若是导数再小一点这个梯度就直接消失了接近0。

梯度爆炸也是同理，若每层导数都是2，传递了多层之后会非常大。

当然防止梯度消失有许多办法，比如使用relu激活函数、使用batchnorm、残差网络等等。

不过本文的重点在于在tensorflow中解决梯度爆炸问题，原理很简单就是梯度修剪。把大于1的导数修剪为1等等。

直接上代码吧：

# 使用Adam梯度下降
     optimizer = tf.train.AdamOptimizer(learningrate)

#     # 裁剪一下Gradient输出，最后的gradient都在[-1, 1]的范围内
#     # 计算导数   cost为损失函数
     gradients = optimizer.compute_gradients(cost)
#     # 限定导数值域-1到1
     capped_gradients = [(tf.clip_by_value(grad, -1., 1.), var) for grad, var in gradients if grad is not None]
#     # 将处理后的导数继续应用到BP算法中
     train_op = optimizer.apply_gradients(capped_gradients)

使用compute_gradients（）方法来计算导数并将其clip。

猜你喜欢

转载自blog.csdn.net/wenqiwenqi123/article/details/80705925

深度学习--解决梯度爆炸方法（含TensorFlow代码）

深度学习中的梯度消失、梯度爆炸问题的原因以及解决方法

深度学习中的梯度消失与梯度爆炸

[深度学习] 梯度消失与梯度爆炸

深度学习-梯度爆炸和梯度消失

【深度学习】：梯度消失与梯度爆炸

深度学习-梯度消失和梯度爆炸

深度学习梯度爆炸与梯度消失

深度学习《梯度消失和梯度爆炸》

深度学习——梯度消失、梯度爆炸

梯度爆炸与深度学习中的梯度剪枝

【深度学习笔记】梯度消失与梯度爆炸

Python深度学习027：什么是梯度、梯度消失、梯度爆炸以及如何解决

训练深度网络的梯度弥散及梯度膨胀问题深度学习基础之-梯度弥散和梯度爆炸及解决办法

深度学习基础之-梯度弥散和梯度爆炸及解决办法

【深度学习】梯度消失与梯度爆炸的原因分析与解决策略

【深度学习】梯度消失和爆炸

梯度爆炸的解决方法: clip gradient

深度学习之如何防止梯度爆炸/梯度消失?

深度学习之详解梯度爆炸和梯度消失

动手深度学习之# 梯度消失、梯度爆炸

面试之深度学习中的梯度下降和梯度爆炸

深度学习笔记 3 梯度消失和梯度爆炸

深度学习基础知识---梯度弥散梯度爆炸

机器学习中的梯度消失、爆炸原因及其解决方法详解机器学习中的梯度消失、爆炸原因及其解决方法

梯度消失、梯度爆炸及其解决方法

梯度消失、梯度爆炸及其表现和解决方法

梯度消失与梯度爆炸以及解决方法

梯度爆炸和梯度消失的原因以及解决方法

详解机器学习中的梯度消失、爆炸原因及其解决方法

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)