CAN-NER Convolutional Attention Network for Chinese Named Entity Recognition - 代码天地

CAN-NER Convolutional Attention Network for Chinese Named Entity Recognition

其他 2020-04-04 10:39:14 阅读次数: 0

CAN-NER: Convolutional Attention Network for Chinese Named Entity Recognition

总结

作者提出了基于注意力机制的卷积神经网络架构，用于中文命名实体识别。

主要的框架是CNN with the local-attention 和Bi-GRU with global self-attention

总体的框架图如下：

Convolutional Attention Layer

字符的嵌入输入 $x$

$x = [x_{ch}; x_{pos};x_{seg}]$

$x_{ch}$ 代表word2vec的词向量

$x_{pos}$ : 代表local context position。CNN的windows size是 $k$ , $x_{pos}$ 的维度为 $k$ ,`独热编码表示`

$x_{seg}$ :作者说是由BMES模式编码的分词信息，没有具体解释

local attention步骤

cnn windows有k个元素， $x_{j-\frac{k-1}{2}}, ...x_j....x_{j+\frac{k+1}{2}}$

$s(x_j,x_k) = v^{T} tanh(W_1x_j + W_2x_k)$

$v \in R^{d_h} W_1; W_2 \in R^{{d_h};de}$

$α_m = \frac {exp s(x_j,x_m)}{\sum_{n \in \{j-\frac{k-1}{2},...,j-\frac{k+1}{2} \}} exp \ s(x_j; x_n)}$

$h_m = α_mx_m$
卷积步骤

$h^c_j = \sum_k[W^c ∗ h_{j-\frac{k-1}{2},...,j-\frac{k+1}{2}}+b_c]$

典型的卷积操作，只不过是最后sum pooling layer

BiGRU_CRF with global Attention

跟BiLSTM+CRF没有什么区别，主要是加了一个中间加了一个global attention

与上面的local attention类似，只不过范围不再是cnn的windows size，而是针对

整个序列

发布了176 篇原创文章 · 获赞 97 · 访问量 13万+

私信关注

猜你喜欢

转载自blog.csdn.net/zycxnanwang/article/details/102852938

CAN-NER Convolutional Attention Network for Chinese Named Entity Recognition

Adversarial Transfer Learning for Chinese Named Entity Recognition with Self-Attention Mechanism

Attention in Character-Based BiLSTM-CRF for Chinese Named Entity Recognition

【Recurrent Attention Convolutional Neural Network for Fine-grained Image Recognition】

第三篇：Named Entity Recognition for Chinese Social Media with Jointly Trained Embeddings

Neural Chinese Named Entity Recognition via CNN-LSTM-CRF and Joint Training with Word Segmentation

第二篇：Improving Named Entity Recognition for Chinese Social Media with Word Segmentation Representation Learning

Improving Named Entity Recognition for Chinese Social Media with Word Segmentation 阅读笔记

An attention-based BiLSTM-CRF approach to document-level chemical named entity recognition

MACNN-Learning Multi-Attention Convolutional Neural Network for Fine-Grained Image Recognition

第七篇：An Empirical Study of Automatic Chinese Word Segmentation for Spoken Language Understanding and Named Entity Recognition

第六篇：Character-Based LSTM-CRF with Radical-Level Features for Chinese Named Entity Recognition

论文笔记 Bipartite Flat-Graph Network for Nested Named Entity Recognition | ACL2020

【论文精读】GPT-NER: Named Entity Recognition via Large Language Models

（翻译）Neural Architectures for Named Entity Recognition

Neural Architectures for Named Entity Recognition 学习笔记

《论文阅读》SetGNER:General Named Entity Recognition as Entity Set Generation

Fast and Accurate Recognition of Chinese Clinical Named Entities with Residual Dilated Convolutions

NLP论文笔记1：Neural Architectures for Named Entity Recognition

论文“Neural Architectures for Named Entity Recognition”阅读体会

实体-关系联合抽取：Neural Architectures for Named Entity Recognition

Improving Chemical Named Entity Recognition in Patents with Contextualized Word Embeddings

CollaboNet: collaboration of deep neural networks for biomedical named entity recognition

论文解读：Example-Based Named Entity Recognition

Robust Self-Augmentation for Named Entity Recognition with Meta Reweighting

paper reading：Part-based Graph Convolutional Network for Action Recognition

《ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs》《Convolutional Neural Network Architectures for Matching Natural Language Sentences》

END-TO-END NAMED ENTITY RECOGNITION AND RELATION EXTRACTION USING PRE-TRAINED LANGUAGE MODELS

第四篇：Named Entity Recognition with Bidirectional LSTM-CNNs

论文笔记 A Unified MRC Framework for Named Entity Recognition | ACL2020

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)