LSTM变种-GRU网络结构

其他 2020-01-16 11:50:58 阅读次数: 0

简介

GRU是LSTM的一种变体，其将忘记门和输入门合成了一个单一的更新门。同样还混合了细胞状态和隐藏状态，加诸其他一些改动。最终的模型比标准的 LSTM 模型要简单，是非常流行的变体。
使用LSTM的原因之一是解决RNN Deep Network的Gradient错误累积太多，以至于Gradient归零或者成为无穷大，所以无法继续进行优化的问题。GRU的构造更简单：比LSTM少一个gate，这样就少几个矩阵乘法。在训练数据很大的情况下GRU能节省很多时间。

GRU模型

与LSTM不同，GRU只有两个门了，分别为更新门和重置门，即图中的 $z_t$ 和 $r_t$ 。更新门用于控制前一时刻的状态信息被带入到当前状态中的程度，更新门的值越大说明前一时刻的状态信息带入越多。重置门用于控制忽略前一时刻的状态信息的程度，重置门的值越小说明忽略得越多。
这里写图片描述

GRU训练

从前面的公式中可以看到需要学习的参数就是 $W_rW_zW_hW_o$ 那些权重参数，其中前三个权重都是拼接的，所以在学习时需要分割出来，即
这里写图片描述
输出层的输入 $y^i_t=W_oh，输出为y^o_t=σ(y^i_t)$ 。
设某时刻的损失函数为 $Et=1/2*(y_d−y^o_t)^2$ ，则某样本的损失为

与前面LSTM网络类似，最终可以推出

GRU与LSTM

这里写图片描述

参考资料：
https://blog.csdn.net/wangyangzhizhou/article/details/77332582
https://blog.csdn.net/lreaderl/article/details/78022724

一夜了

发布了98 篇原创文章 · 获赞 337 · 访问量 48万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/yiyele/article/details/80672554

LSTM变种-GRU网络结构

几种常见的循环神经网络结构RNN、LSTM、GRU

RNN的优秀变种: LSTM & GRU

Understanding LSTM Networks（LSTM的网络结构）

GRU和LSTM结构对比

9 神经序列模型之 RNN 及其变种 LSTM、GRU

LSTM与GRU神经网络

通俗易懂LSTM｜RNN的变种结构 | LSTM长短期记忆网络

LSTM和GRU结构及原理介绍

RNN、GRU和LSTM的结构与公式讲解

[深度学习]理解RNN, GRU, LSTM 网络

LSTM和GRU网络的高级运用实例

LSTM和GRU网络的介绍和区别

循环神经网络-GRU和LSTM

4.4 高级神经网络结构-什么是 LSTM 循环神经网络

GRU与LSTM

LSTM与GRU

LSTM & GRU

GRU and LSTM

LSTM 与 GRU

Pytorch神经网络实战学习笔记_23 循环神经网络结构：LSTM结构+双向RNN结构

自然语言处理 - 梯度消失和RNN变种 (LSTM, GRU, 双向RNN, 多层RNN)

机房网络结构

网络结构

refinedet网络结构

LoRa网络结构

VOTE网络结构

VGG网络结构

osi网络结构

光网络结构

今日推荐

“开源信徒”周鸿祎开源360智脑大模型

华为ensp中vrrp虚拟路由器冗余协议原理及配置命令

基于Python爬虫广东广州水酒店宾馆数据可视化系统设计与实现(Django框架) 研究背景与意义、国内外研究现状

知识融合：知识图谱构建的关键技术

文心一言收费还是免费：全面解析其价格策略与服务价值

百万用户通话新风潮：仅需50秒，无界AI让彩铃变身短视频

【STM32项目】基于STM32多传感器融合的新型智能导盲杖设计（完整工程资料源码）

文生视频大模型Sora的复现经验

腾讯云函数计算技术：云原生架构下的Serverless与微服务新篇章

干货分享｜JumpServer 三种常见的文件传输方式效果对比

【榜单公布】2023年度征文活动已结束

周排行

理解指针，*p,p=&c

LeetCode 90. 子集 II JavaScript实现

给IT人的15点建议：苦逼程序员的辛酸反省与总结

2019/09/05

通过优化App来适应网络（WWDC 2018 session 719）

网络通信协议自动转换之thrift到http

在vue中使用swiper4.x

java优化-java代码性能优化学习总结

python中类的函数中的self

面试-基础篇

每日归档

更多

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)

2024-04-07(4)

2024-04-06(65)