基于Attention理论的LSTM 隐藏层权重自调节机制

编程语言 2018-11-29 21:58:48 阅读次数: 0

版权声明：我是南七小僧，微信: to_my_love ，寻找人工智能相关工作，欢迎交流思想碰撞。 https://blog.csdn.net/qq_25439417/article/details/84627022

整体思路如下：

在两层LSTM结构中，或者是BiLSTM结构中，其实不同隐藏层的输出权重应该更有所选择才好，比如用于情感分析的一句话，我今天心情很好，上午去打球了，下午去打游戏了。如果我们采用传统的方法去训练LSTM再分类的话，会发现，这个分类结果可能是中性，当然这和训练集有关，如何减小这种误判断呢。我们就需要在Hidden的时候引入注意力机制，自动调节hidden，忽略对结果不重要的语素。即加大我今天心情很好，减小上午去打球了，采用乘法门来控制，类似于LSTM中的遗忘机制，这里采用sigmoid来激活，控制门大小。

网络结构如下：

整体效果：

比之前用传统的LSTM 以及一些变种的LSTM效果都要好，胜过单一matching pyramid。

猜你喜欢

转载自blog.csdn.net/qq_25439417/article/details/84627022

基于Attention理论的LSTM 隐藏层权重自调节机制

【深度学习】基于Keras的Attention机制代码实现及剖析——LSTM+Attention

使用Keras实现基于注意力机制（Attention）的 LSTM 时间序列预测

基于Bi-lstm+attention机制实现经济领域的实体关系抽取（数据及代码实现）

Attention机制理解（参考代码和理论）

Attention机制（将其引入到Lstm序列分类中）

基于self-attention检测lstm后门

分类预测 | MATLAB实现基于Attention-LSTM的数据分类预测多特征分类预测(长短期记忆网络融合注意力机制分类预测，含混淆矩阵图、分类图)

多元回归预测 | Matlab基于卷积神经网络-长短期记忆网络结合注意力机制(CNN-LSTM-Attention)回归预测，多变量输入模型

基于self-attention的LSTM时间序列预测Python程序

深度学习笔记（2）：caffe 加新层 Attention LSTM layer

cs231n---RNN、图像字幕、注意力机制Attention、梯度消失、爆炸、LSTM

易于理解的一些时序相关的操作(LSTM)和注意力机制(Attention Model)

多图+公式全面解析RNN,LSTM,Seq2Seq,Attention注意力机制

LSTM+注意力机制(Attention)实现时间序列预测(PyTorch版)

LSTM隐藏层规模（隐藏层节点数）

attention_lstm代码

【深度学习】基于Keras的Attention机制代码实现及剖析——Dense+Attention

基于attention机制实现 CRNN OCR文字识别

学渣适用版——Transformer理论和代码以及注意力机制attention的学习

[深度学习]循环神经网络：RNN，LSTM，GRU，Attention机制，沿时间的截断反向传导算法

知识追踪实战：lstm+ Multi-head Attention注意力机制的学生做题成绩预测实战

多维时序 | MATLAB实现WOA-CNN-LSTM-Attention多变量时间序列预测（SE注意力机制）

深度学习笔记——基于双向RNN（LSTM、GRU）和Attention Model的句子对匹配方法

深度学习：基于TensorFlow的双层BiDirection_Attention_LSTM的北京PM2.5数据集预测

基于深度学习的轴承寿命预测实践，开发CNN、融合LSTM/GRU/ATTENTION

LSTM+CNN+ATTENTION（QA）

attention机制

attention 机制

Attention机制（Bahdanau attention & Luong Attention）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)