HAN（Hierarchical Attention Network）

其他 2020-02-11 10:44:01 阅读次数: 0

本文主要介绍CMU在2016年发表在ACL的一篇论文：Hierarchical Attention Networks for Document Classification及其代码复现。

该论文是用于文档级情感分类（document-level sentiment classification）的，其模型架构如下：

整个网络结构包括四个部分：

　　1）词序列编码器

　　2）基于词级的注意力层

　　3）句子编码器

　　4）基于句子级的注意力层

　　整个网络结构由双向GRU网络和注意力机制组合而成，具体的网络结构公式如下：

词序列编码器

给定一个句子中的单词 $W_{it}$ ，其中 i 表示第 i 个句子，t 表示第 t 个词。通过一个词嵌入矩阵 $W_{e}$ 将单词转换成向量表示，具体如下所示：

$x_{it} = W_{e}w_{it}$

接下来看看利用双向GRU实现的整个编码流程：

最终的 $h_{it} = [ \rightarrow h_{it}, \leftarrow h_{it} ]$

词级的注意力层

注意力层的具体流程如下：

上面式子中， $u_{it}$ 是 $h_{it}$ 的隐层表示， $a_{it}$ 是经 softmax 函数处理后的归一化权重系数， $u_{w}$ 是一个随机初始化的向量，之后会作为模型的参数一起被训练， $s_{i}$ 就是我们得到的第 i 个句子的向量表示。

句子编码器

也是基于双向GRU实现编码的，其流程如下:

公式和词编码类似，最后的 $h_{i}$ 也是通过拼接得到的

句子级注意力层

注意力层的流程如下，和词级的一致

最后得到的向量 $v$ 就是文档的向量表示，这是文档的高层表示。接下来就可以用可以用这个向量表示作为文档的特征

分类

Reference

用于文本分类的多层注意力模型（Hierachical Attention Nerworks）

达观数据曾彦能：如何用深度学习做好长文本分类与法律文书智能化处理

一枚小码农

发布了74 篇原创文章 · 获赞 17 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/sinat_25394043/article/details/103990376

HAN（Hierarchical Attention Network）

Hierarchical Attention Network for Document Classification阅读笔记

Sequential Recommender System based on Hierarchical Attention Network

Hierarchical Attention Based Semi-supervised Network Representation Learning

中文短文本分类实例十二-HAN（Hierarchical Attention Networks for Document Classification）

HAN - Heterogeneous Graph Attention Network 异构图注意力网络 WWW 2019

The fall of RNN / LSTM-hierarchical neural attention encoder, Temporal convolutional network (TCN)

自然语言处理 | (29) 基于Hierarchical Attention Network的文本分类原理

注意力之Visual Object Tracking by Hierarchical Attention Siamese Network

读论文：《Hierarchical Attention Network for Document Classification》—— 用于文本分类的层次注意力网络

Residual Attention Network 翻译

Residual Attention Network

Pyramid Attention Network for Semantic Segmentation

Residual attention network for image classification

residual attention network 论文解读

Dual attention network for scene segmentation

「Computer Vision」Notes on Residual Attention Network

《17.Residual Attention Network for Image Classification》

Residual Attention Network for Image Classification 论文阅读

Text Understanding with the Attention Sum Reader Network

Dual Attention Network for Scene Segmentation讲解

Harmonious Attention Network for Person Re-Identification

Residual Attention Network——TensorFlow低阶API实现

Paper | Residual Attention Network for Image Classification

文章阅读：Dual Attention Network for Scene Segmentation

Text Understanding with the Attention Sum Reader Network翻译

Graph Attention Network的本质是什么？

Heterogeneous Graph Attention Network阅读笔记

DMSANet: Dual Multi Scale Attention Network

【KGAT】Knowledge Graph Attention Network for Recommendation

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)