复习一下RNN吧 - 代码天地

复习一下RNN吧

其他 2019-04-22 17:23:36 阅读次数: 0

经典的RNN结构:

由图可得，一输入一输出，因此成为输入序列和输出序列具有相同的时间长度

2）我们为其加上时序性

将时间信息作为一个坐标信息加入，

则展开，我们可得

RNN中的“权值共享”：任意时刻 $t\in \{1,2,...,T\}$ ，所有的权值（包括 $W_{ih}$ , $b_{ih}$ , $W_{hh}$ , $b_{hh}$ , $W_{ho}$ , $b_{ho}$ ）都相等

3)Sequence to Sequence模型

本质：是一个encoder和decoder的过程，不断地将前一个时刻 $t-1$ 的输出作为后一个时刻 $t$ 的输入

encode端：编码器encoder把所有的输入序列都编码成一个统一的语义向量context（不断地将前一个时刻 $t-1$ 的输出作为后一个时刻 $t$ 的输入）

例如：

与RNN的区别：Seq2Seq结构不再要求输入和输出序列有相同的时间长度！

decode端：

由上图可得，输入经过RNN，最后经过sigmoid 或 argmax获得其当前标签（index）,经过int2str后将其输出的字符作为输入送入第二时间序列（下一状态）

4）Attention注意力机制

解决问题：1）当输入信息过大时（句子过长），一个context存储不下，会造成精度下降

2）每次只用到编码器最后一个隐藏层状态，信息利用率很低

1）encoder把所有的输入序列都编码成一个统一的语义向量context，其中encoder的隐藏层状态 $h_t$ 代表对不同时刻输入 $x_t$ 的编码结果，会使得context装不下，因此这里引用了多次分别输入（类似于多特征图融合FPN）

细节如下：

祝好~！

猜你喜欢

转载自blog.csdn.net/weixin_38740463/article/details/89045996

复习一下RNN吧

复习一下吧, 排序算法

来一起复习一下Flex布局吧！

复习一下UML

复习一下Kafka

了解一下Cookie吧

Qt的QWaitCondition了解一下吧

测试一下吧

简单的了解一下AQS吧

[日记]记一下考研吧

总结一下Git的使用吧

浅尝一下 ElasticSearch 的 Analyzer吧

js的隐式类型转换你懂了嘛一起来复习一下吧

mysql性能优化复习一下

复习一下几个IO模型

复习一下xml（c）

今天复习一下多线程

今天复习一下IO流

今天复习一下异常

今天复习一下集合

VUE组件复习一下

2018.9.17 小小的复习一下

复习一下js的prototype 属性

复习一下request 的常用方法

复习总结一下: 指针的内容

复习一下工厂模式

复习一下什么是闭包

还是记录一下吧。。。capistrano for Rails3

讲一下为什么要架构吧

前端er来学习一下webWorker吧

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)