【Deep Learning笔记】循环神经网络

其他 2020-02-23 22:43:47 阅读次数: 0

在这里插入图片描述

文章目录

循环神经元（Recurrent Neuron）
循环神经网络（RNN）
消失梯度问题（Vanishing Gradient Problem）
激增梯度问题（Exploding Gradient Problem）

循环神经元（Recurrent Neuron）

循环神经元是在T时间内将神经元的输出发送回给它。如果你看图，输出将返回输入t次。展开的神经元看起来像连接在一起的t个不同的神经元。这个神经元的基本优点是它给出了更广义的输出。

循环神经网络（RNN）

循环神经网络特别用于顺序数据，其中先前的输出用于预测下一个输出。在这种情况下，网络中有循环。隐藏神经元内的循环使他们能够存储有关前一个单词的信息一段时间，以便能够预测输出。隐藏层的输出在t时间戳内再次发送到隐藏层。展开的神经元看起来像上图。只有在完成所有的时间戳后，循环神经元的输出才能进入下一层。发送的输出更广泛，以前的信息保留的时间也较长。

然后根据展开的网络将错误反向传播以更新权重。这被称为通过时间的反向传播（BPTT）。

消失梯度问题（Vanishing Gradient Problem）

激活函数的梯度非常小的情况下会出现消失梯度问题。在权重乘以这些低梯度时的反向传播过程中，它们往往变得非常小，并且随着网络进一步深入而“消失”。这使得神经网络忘记了长距离依赖。这对循环神经网络来说是一个问题，长期依赖对于网络来说是非常重要的。

这可以通过使用不具有小梯度的激活函数ReLu来解决。

激增梯度问题（Exploding Gradient Problem）

这与消失的梯度问题完全相反，激活函数的梯度过大。在反向传播期间，它使特定节点的权重相对于其他节点的权重非常高，这使得它们不重要。这可以通过剪切梯度来轻松解决，使其不超过一定值。

理想007

发布了650 篇原创文章 · 获赞 190 · 访问量 5万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43838785/article/details/104441941

【Deep Learning笔记】循环神经网络

【Deep learning】循环神经网络RNN

Deep Learning 循环神经网络

【Deep Learning笔记】神经网络基础

【Deep Learning】Tensorflow实现动态循环神经网络

【Deep Learning】Tensorflow实现循环神经网络

深度学习（Deep Learning）：循环神经网络一（RNN）

Deep Learning Specialization课程笔记——浅层神经网络

Deep Learning Specialization课程笔记——神经网络编程基础

Deep Learning Specialization课程笔记——神经网络基础

Deep Learning Specialization课程笔记——深层神经网络

【Deep Learning笔记之卷积神经网络的架构】

Deep Learning - 1 神经网络

[Deep Learning] 神经网络基础

Deep learning 与传统的神经网络的区别

深度学习（Deep Learning）读书思考八：循环神经网络三（RNN应用）

深度学习（Deep Learning）读书思考七：循环神经网络二（LSTM）

深度学习（Deep Learning）读书思考六：循环神经网络一（RNN）

《Neural Networks and Deep Learning》学习笔记三－神经网络输出层神经元个数

Deep Learning 学习笔记1：神经元、神经网络与深度学习

吴恩达deep learning ai 笔记总结(1-2) 神经网络与深度学习-神经网络基础

吴恩达deep learning ai 笔记总结(1-4) 神经网络与深度学习-深层神经网络

吴恩达deep learning ai 笔记总结(1-3) 神经网络与深度学习-浅层神经网络

【Deep Learning】Tensorflow实现卷积神经网络

【Deep Learning】Tensorflow实现简单神经网络

Deep Learning - 3 改进神经网络的学习方式

[Deep-Learning-with-Python]神经网络的数学基础

【Deep Learning with Python】神经网络的数学基础

[Deep Learning] 前馈神经网络FNN

【Deep learning】卷积神经网络CNN算法原理

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)