【论文笔记】Document Embedding Enhanced Event Detection with Hierarchical and Supervised Attention - 代码天地

【论文笔记】Document Embedding Enhanced Event Detection with Hierarchical and Supervised Attention

其他 2019-12-24 20:50:48 阅读次数: 0

背景

Challenge 1:
很难从孤立的句子中识别事件，因为同一个事件触发器可能在不同的上下文中表示不同的事件类型。
Challenge 2:
文档级信息对于ED也很重要，因为同一文档中的句子虽然可能包含不同类型的事件，但往往与文档的主题相关。
Challenge 3:
基于特征的方法有两大局限性。首先，其中使用的特征往往需要人工设计，可能涉及自然语言处理导致的错误传播；其次，它们通过构造推理规则来发现文档级的事件间信息，这既费时又难以使规则集尽可能完整。
Challenge 4:
由于受无监督训练过程的限制，文档级表示无法具体捕获与事件相关的信息。

模型

EDODEL模块

单词级embeddings

\(g_{it}=[w_{it},e_{it}]\)
\(h_{it}=[GRU_w^→(g_{it}),GRU_w^←(g_{it})]\)
\(u_{it}=tanh(W_wh_{it})\)
\(α_{it}=u^T_{it}c_w\)
\(s_i=\sum^T_{t=1}α_{it}h_{it}\)
\(E_w(α^∗,α)=\sum^L_{i=1}\sum^T_{t=1}(α^∗_{it}-α_{it})^2\)

句子级embeddings

\(q_i=[GRU_s^→(s_i),GRU_s^←(s_i)]\)
\(t_i=tanh(W_sq_i)\)
\(β_i=t^T_ic_s\)
\(d=\sum^L_{i=1}β_is_i\)
\(E_s(β^∗,β)=\sum^L_{i=1}(β^∗_i-β_i)^2\)

DEED模块

\(r_{jt}=[w_{jt},e_{jt},d]\)
\(f_{jt}=[GRU_e^→(r_{jt}),GRU_e^←(r_{jt})]\)
\(J(y,o)=\sum^L_{j=1}\sum^T_{t=1}\sum^K_{k=1}I(y_{jt}=k)logo^{(k)}_{jt}\)

DEEB-RNN模型的联合训练

\(J(θ)=\sum_{∀d∈ϕ}(J(y,o)+λE_w(α^∗,α)+µE_s(β^∗,β))\)

实验

数据集和超参数

数据集：ACE2005
维数：hidden-size:$GRU_w$300, $GRU_s$200, $GRU_e$300, $W_w$600, $W_s$400, 实体50
batch-size：25
dropout：0.5

猜你喜欢

转载自www.cnblogs.com/kisetsu/p/12092994.html

【论文笔记】Document Embedding Enhanced Event Detection with Hierarchical and Supervised Attention

【论文复现】Hierarchical Attention Networks for Document Classification

论文笔记：DeBERTa: Decoding-enhanced BERT with Disentangled Attention

Hierarchical Attention Based Semi-supervised Network Representation Learning

Hierarchical Attention Network for Document Classification阅读笔记

Object Instance Mining for Weakly Supervised Object Detection 论文笔记

Hierarchical Attention Networks for Document Classification 实现篇

paper:Hierarchical Attention Networks for Document Classification

论文笔记：TEM: Tree-enhanced Embedding Model for Explainable Recommendation

【论文笔记】 VIT论文笔记，重构Patch Embedding和Attention部分

论文笔记：Attention Guided Anomaly Detection and Localization in Images

【论文精读】COLING 2022 -Event Detection with Dual Relational Graph Attention Networks

论文笔记：Heterogeneous Memory Enhanced Multimodal Attention Model for Video Question Answering

Hierarchical Attention Networks for Document Classiﬁcation学习笔记

[论文笔记]Multi-Channel CNN-based Object Detection for Enhanced Situation Awareness

【论文笔记】Hierarchical Paired Channel Fusion Network for Street Scene Change Detection

【论文阅读】MFAN: Multi-modal Feature-enhanced Attention Networks for Rumor Detection --- 多模态，谣言检测，注意力机制

Event Detection via Gated Multilingual Attention Mechanism（中文翻译）

《SuperPoint: Self-Supervised Interest Point Detection and Description》论文笔记

[论文笔记] Binary Analysis with Architecture and Code Section Detection Using Supervised ML

【论文笔记】Evaluation of Hierarchical Clustering Algorithms for Document Datasets

Hierarchical Attention Networks for Document Classification 模型理解篇

文本分类《Multilingual Hierarchical attention networks for document classification》

论文笔记：Large-Scale Embedding Learning in Heterogeneous Event Data（HEBE）

HAN（Hierarchical Attention Network）

论文阅读：HIERARCHICAL MULTI-SCALE ATTENTION FOR SEMANTIC SEGMENTATION

读论文：《Hierarchical Attention Network for Document Classification》—— 用于文本分类的层次注意力网络

论文笔记：Progressive Attention Guided Recurrent Network for Salient Object Detection

【论文笔记】Object detection with location-aware deformable convolution and backward attention filtering

论文笔记-Learning Lightweight Lane Detection CNNs by Self Attention Distillation

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)