双向RNN - 代码天地

双向RNN

企业开发 2023-04-08 05:37:49 阅读次数: 0

普通的RNN只能依据之前时刻的时序信息来预测下一时刻的输出，但在有些问题中，当前时刻的输出不仅和之前的状态有关，还可能和未来的状态有关系。

比如预测一句话中缺失的单词不仅需要根据前文来判断，还需要考虑它后面的内容，真正做到基于上下文判断。

BRNN有两个RNN上下叠加在一起组成的，输出由这两个RNN的状态共同决定。

从前往后：从1到t时刻正向计算，得到并保存每个时刻的隐藏层的输出向后传播

从后往前：从t时刻向1反向传播，得到并保存每个时刻向后隐藏层的输出

$\overrightarrow{h_t}=g(x_tW_{xh}^{(f)}+\overrightarrow{h}_{t-1}W_{hh}^{(f)}+b_h^{(f)})$

$\overleftarrow{h_t^{'}}=g(x_tW_{xh}^{(b)}+\overleftarrow{h}_{t+1}^{'}W_{hh}^{(b)}+b_h^{(b)})$

对于每个时刻t，输入会同时提供给两个方向相反的RNN。

计算过程是，先从前往后计算h_1、h_2...，h_t，再从后往前计算，最终得到两个隐状态

完整的隐藏状态是把前向和后向的隐藏状态拼接起来

$H_t=[\overrightarrow{h_t},\overleftarrow{h^{'}_t}]$

如果前向和后向的隐状态都是1000*1维的，拼接后的 $H_t$ 就是1000*2维的

输出由这两个单向RNN共同决定：

$y_t=H_tW_{hq}+b_q$

注意：

双向RNN需要保存两个方向的权重矩阵，所以需要的内存约为RNN的两倍。

两条RNN完全独立，不共享参数也不共享状态

参考：(46条消息) Keras学习：05.RNN和双向RNN讲解及实践_AI学习社的博客-CSDN博客_双向rnn

41-双向循环神经网络和代码实现-自然语言处理-pytorch_哔哩哔哩_bilibili

RNN模型与NLP应用(5/9)：多层RNN、双向RNN、预训练_哔哩哔哩_bilibili

(46条消息) （五）通俗易懂理解——双向LSTM_Dreamdreams8的博客-CSDN博客_双向lstm

(46条消息) 一幅图真正理解LSTM、BiLSTM_⊙月的博客-CSDN博客_bilstm

猜你喜欢

转载自blog.csdn.net/Michale_L/article/details/126304723

双向RNN

Keras学习:RNN及双向RNN

Learning RNN from scratch (ＲＮＮ神经网络参数推导)

深层双向RNN

双向和多重 RNN

GRU及双向RNN介绍

GRU及双向RNN介绍

GRU/双向RNN/多层RNN速度复习

tensorflow构建双向深层RNN

大杀器双向RNN

深度学习笔记——RNN（LSTM、GRU、双向RNN）学习总结

5-RNN-03_双向rnn_英文小短文

Keras学习：05.RNN和双向RNN讲解及实践

BiLSTM+CRF (一）双向RNN 浅谈

自然语言处理 - 梯度消失和RNN变种 (LSTM, GRU, 双向RNN, 多层RNN)

实现一个双向的RNN（用于分类的）

Keras实现CNN、RNN（attention 双向RNN）及两者的融合

tf.contrib.rnn.static_bidirectional_rnn和MultiRNNCell构建多层静态双向LSTM

tf.nn.bidirectional_dynamic_rnn和MultiRNNCell构建双向多层RNN(LSTM)

中文文本分类之TextRNN TensorFlow之RNN：堆叠RNN、LSTM、GRU及双向LSTM

RNN

循环神经网络(RNN)入门帖：向量到序列，序列到序列，双向RNN，马尔科夫化

TensorFlow之RNN：堆叠RNN、LSTM、GRU及双向LSTM 深度学习之循环神经网络（RNN）循环神经网络之LSTM和GRU 》

双向长短时记忆循环神经网络详解（Bi-directional LSTM RNN）

Bi-directional LSTM RNN（双向长短时记忆循环神经网络）

PyTorch--双向递归神经网络(B-RNN)概念，源码分析

深度学习笔记——基于双向RNN（LSTM、GRU）和Attention Model的句子对匹配方法

序列模型（5）-----双向神经网络（BRNN）和深层循环神经网络（Deep RNN）

长短期记忆网络 LSTM 深层循环神经网络 Deep RNN 双向循环神经网络 Bidirectional RNN 动手学深度学习v2

当RNN神经网络遇上NER（命名实体识别）：双向LSTM，条件随机场（CRF），层叠Stack LS

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)