recurrent neural netword,lstm学习记录

其他 2019-07-05 15:31:21 阅读次数: 0

参考：https://blog.csdn.net/zhaojc1995/article/details/80572098

1，rnn在时间层面上会存在梯度消失，原因是由于sigmoid和tan的导数都小于一导致。即使使用relu，则可能会遇到梯度爆炸问题。且过大的步长会导致学死，因为一旦全部为0则无法翻过来。

sigmoid导数值范围为(0,0.25]，反向传播时会导致“梯度消失“。tanh函数导数值范围【0，1】，相对好一点。
sigmoid函数不是0中心对称，tanh函数是，可以使网络收敛的更好。

2,LSTM比rnn多了一个输出，即使cell的长期状态。而rnn的状态可以认为是短期的状态。

猜你喜欢

转载自blog.csdn.net/qq_30362711/article/details/84027972

recurrent neural netword,lstm学习记录

Recurrent Neural Networks, LSTM, GRU

RNN(Recurrent Neural Networks)和LSTM

Recurrent Neural Network

RNN(Recurrent Neural Networks)

Introduction to Recurrent Neural Networks

Independently Recurrent Neural Network

Recurrent Neural Networks——RNN

Recurrent Neural Networks 简述

Training Recurrent Neural Network

Gated Recurrent Neural Networks

019 Recurrent Neural Networks

RNN循环神经网络（Recurrent Neural Network）学习

【深度学习理论】Recurrent Neural Network (RNN) - 2

【深度学习理论】Recurrent Neural Network (RNN) - 1

Recurrent Neural Network(1):Architecture

A RECURRENT NEURAL NETWORK WITHOUT CHAOS

Recurrent Neural Networks by Example in Python

5 、Short-Term Residential Load Forecasting based on LSTM Recurrent Neural Network

李宏毅机器学习课程笔记9：Recurrent Neural Network 李宏毅机器学习课程笔记9：Recurrent Neural Network

Coursera深度学习课程 DeepLearning.ai 编程作业——Building your Recurrent Neural Network - Step by Step

李宏毅机器学习课程笔记9：Recurrent Neural Network

深度学习 course5 week1 Building+a+Recurrent+Neural+Network+-+Step+by+Step

莫烦pytorch学习笔记（十二）——循环神经网络RNN（Recurrent Neural Network）

论文学习《Recurrent Convolutional Neural Net works for Text Classiﬁcation》

深度学习3：循环神经网络Recurrent Neural Network（基于Python MXNet.Gluon框架）

2021李宏毅机器学习课程笔记——Recurrent Neural Network

深度学习4. 循环神经网络 – Recurrent Neural Network | RNN

循环神经网络（Recurrent Neural Networks，RNN）模型深度学习

RNN:The Unreasonable Effectiveness of Recurrent Neural Networks

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)