tensorflow关于lstm/gru实现细节 - 代码天地

tensorflow关于lstm/gru实现细节

其他 2020-01-11 18:57:34 阅读次数: 0

tf.nn.dynamic_rnn 详解

参考： https://zhuanlan.zhihu.com/p/43041436

output, last_state = tf.nn.dynamic_rnn(
    cell,
    inputs,
    sequence_length=None,
    initial_state=None,
    dtype=None,
    parallel_iterations=None,
    swap_memory=False,
    time_major=False,
    scope=None
)

name	shape
cell	int, lstm or gru的神经元数，与输出size有关
input	[batch_size, max_length, embedding_size]
sequence_length	[int, int,…]对应输入序列的实际长度，应用于padding的非定长输入
output	[batch_size, max_length, cell]
state	[batch_size, cell.output_size ] or [2, batch_size, cell.output_size ]

output 和state的关系

在这里插入图片描述

以上两个图是lstm的结构，对应的last_state有【 $c_t, h_t$ 】，cell_state(应该记住或遗忘的状态）， $h_t$ （实际的输出），因此state是【2， batch_size, cell】
$c_t$ 对应中间的每一个状态【batch_size， max_length, cell_size】
last_state中的 $h_t$ 对应的是output中最后一个输出（每一个输入最后一个不为0的部分）

例如：输入【3，6，4】，cell=5
output = 【3，6，5】
last_state = 【2，3，5】

在这里插入图片描述
GRU是LSTM修改的RNN，对应只有一个输出，以及向后层传递的 $h_t$ ，所以state=【batch_size, cell_size】

同理，对于gru,例如：输入【3，6，4】，cell=5
output = 【3，6，5】
last_state = 【3，5】

tf.nn.bidirectional_dynamic_rnn

林林宋

发布了98 篇原创文章 · 获赞 9 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_40168949/article/details/100535013

tensorflow关于lstm/gru实现细节

用python实现LSTM/GRU

人肉实现simpleRnn GRU LSTM

TensorFlow2教程-LSTM和GRU

第二十一节，使用TensorFlow实现LSTM和GRU网络

[tensorflow应用之路]RNN预测时间序列原理及LSTM/GRU算法实现

Tensorflow LSTM实现 Tensorflow[LSTM]

TF之LSTM/GRU：基于tensorflow框架对boston房价数据集分别利用LSTM、GRU算法(batch_size调优对比)实现房价回归预测案例

GRU与LSTM

LSTM与GRU

LSTM & GRU

GRU and LSTM

LSTM 与 GRU

LSTM&GRU原理及pytroch实现

Tensorflow2.0 循环神经网络 LSTM与GRU

TensorFlow实现LSTM（分类）

TensorFlow实现LSTM（回归）

tensorflow使用多层RNN（lstm）预测手写数字实现部分细节及踩坑总结

中文文本分类之TextRNN TensorFlow之RNN：堆叠RNN、LSTM、GRU及双向LSTM

tensorflow中关于BahdanauAttention以及LuongAttention实现细节

循环神经网络RNN、LSTM、GRU实现股票预测

RNN、LSTM、GRU网络通俗概述，及torch实现

LSTM/GRU详细代码解析+完整代码实现

python pytorch实现RNN,LSTM，GRU，文本情感分类

LSTM和GRU

GRU与LSTM总结

LSTM和GRU的区别

RNN，LSTM和GRU

RNN-LSTM-GRU

LSTM和GRU介绍

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)