【NLP】NMT之RNN结构 - 代码天地

【NLP】NMT之RNN结构

其他 2018-11-07 11:14:54 阅读次数: 0

RNN一般有三种结构：vanilla RNN，LSTM，GRU。

1. vanilla RNN

最简单的RNN：

$\small \\a_t = tanh(W_a[a_{t-1},X_t]+b_a)\\ y_t = softmax(W_ya_t + b_y)$

2. GRU

使用两个门，reset使用多少过去cell的信息，update门控制该信息有多少用于更新当前cell，在GRU中a即为 c。

$\small \\ g_r = \sigma (W_r[c_{t-1}, X_t] + b_r) \\ g_u = \sigma (W_u[c_{t-1}, X_t] + b_u) \\ \tilde{c_t} = tanh(W_c[g_rc_{t-1}, X_t] + b_c) \\ c_t = g_u \tilde{c_t} + (1-g_u)c_{t-1}$

3. LSTM

使用三个门。

$\small \\ g_u = \sigma (W_u[c_{t-1}, X_t] + b_u) \\ g_f = \sigma (W_f[c_{t-1}, X_t] + b_f) \\ g_o = \sigma (W_o[c_{t-1}, X_t] + b_o) \\ \tilde{c_t} = tanh(W_c[c_{t-1}, X_t] + b_c) \\ c_t = g_u \tilde{c_t} + g_fc_{t-1} \\ a_t = g_oc_t$

4. attention model

attention 也用于缓解long-tem dependency。

$\small \\encoder: h_j = lstm([h_{j-1},X_j]) \\context\ vector: c_i = \sum _{j=1}^{T_x}\alpha_{ij}h_j\\ \\decoder: s_i = lstm([s_{i-1}, c_i])$

$\small \alpha$ 使用前往网络训练计算：

$\small \alpha_{ij} = softmax(feedforward([s_{i-1},h_j]))$

猜你喜欢

转载自blog.csdn.net/u013166817/article/details/83648327

【NLP】NMT之RNN结构

【NLP】NMT之BLEU

二、NLP学习之RNN模型

Tensorflow nmt的整体结构

tensorflow nmt 源码结构梳理

NLP三大特征处理器之——RNN

nmt

NLP入门（四）RNN

NLP 02 RNN

基于RNN+Attention的机器翻译（NMT）

RWTHLM 源码分析(四)之rnn结构

CNN/RNN在NLP领域的对比

NLP入门（2）— RNN & LSTM

NLP 3.1 RNN,LSTM,GRU

【NLP】Attention机制和RNN

nmt框架笔记之数据读取

NLP中的CNN和RNN模型对比

NLP学习记录3——Light RNN 研读

NLP学习记录2——RNN&LSTM

第13天：NLP补充——RNN算法

图解NLP模型发展：从RNN到Transformer

NLP入门（五）RNN的前向传播

NLP领域数据集集锦——100+个数据集！！！dialog，chatbot，nmt……均可使用

NLP学习笔记（七）神经网络机器翻译（NMT）

RNN 结构详解

Tensorflow RNN结构解读

RNN结构总结

通熟易懂RNN｜RNN与RNN的变种结构 | 上

TensorFlow 之 RNN 使用

TesorFlow之RNN与LSTM

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)