sequence labeling笔记（一） - 代码天地

sequence labeling笔记（一）

其他 2020-02-23 21:06:16 阅读次数: 0

最近一直在做序列标注的工作，记录一下在工作中读的一些论文，今天记录这两篇，分别是《Morphosyntactic Tagging with a Meta-BiLSTM Model over Context Sensitive Token Encodings》和《Hierarchically-Refined Label Attention Network for Sequence Labeling》，分别来自Google和浙大。

Morphosyntactic Tagging with a Meta-BiLSTM Model over Context Sensitive Token Encodings

这篇文章基于字+词做pos tagging，但这里的做法和寻常的有些不一样，一般做法是将word做padding到和char一样长，然后concat扔到bilstm中去训练，最后接CRF得到每一个token的词性输出。这篇文章是分别基于char和word去训练一个model，各自进入一个bilstm，计算loss，char model和wordmodel的mlp输出，进入一个meta bilstm，最后再过一个mlp得到输出。

作者基于WSJ和UD的数据集，针对多种语言进行了词法、句法实验，并分析了这种model各个module对最后结果的影响，具体不赘述了。在我看来，这种对char和word分别循环建模，然后融合结果再过一层bilstm的做法，简单粗暴，用来做实验具有一定的意义，但如果要满足实际的线上使用，估计会慢成狗吧。

Hierarchically-Refined Label Attention Network for Sequence Labeling

这篇文章干的事这么一件事，提出了一个BiLSTM-LAN的架构，以往的序列标注都是在BiLSTM后面接一层CRF，得到token的label输出，但是这篇文章，是在BiLSTM层后面接一层注意力推断层，基于BiLSTM得到的隐态，计算推断得到的label，然后将隐态和得到的label融合，输入下一个类似结构中，继续推断，见下图：

同样实验也是在WSJ和UD上做的，但从论文给出的实验结果来看，确实提升有限，当然文章没有细看，有时间再推敲。

发布了117 篇原创文章 · 获赞 8 · 访问量 5万+

私信关注

猜你喜欢

转载自blog.csdn.net/u014257192/article/details/102655858

sequence labeling笔记（一）

Sequence Labeling Problem

论文阅读笔记：《Contextual String Embeddings for Sequence Labeling》

flair embedding--《Contextual String Embeddings for Sequence Labeling》阅读笔记

李宏毅机器学习课程笔记8：Structured Learning - Linear Model、Structured SVM、Sequence Labeling

深度学习笔记——理论与推导之Structured Learning【Sequence Labeling Problem】（八）

番外.李宏毅学习笔记.ST4.Sequence Labeling

学习：Bi-LSTM-CRF for Sequence Labeling

Implicitly-Defined Neural Networks for Sequence Labeling

李宏毅机器学习课程笔记8：Structured Learning - Linear Model、Structured SVM、Sequence Labeling 李宏毅机器学习课程笔记8：Structured Learning - Linear Model、Structured SVM、Sequence Labeling

Sequence to Sequence Learning with Neural Networks阅读笔记

Convolutional Sequence to Sequence Learning 论文笔记

Sequence Models 笔记

《Sequence Models》课堂笔记

POJ 3581 Sequence 笔记

用序列标注Sequence Labeling来做event detection

Accelerating BERT Inference for Sequence Labeling via Early-Exit

Convolutional Sequence to Sequence Learning 论文笔记 Convolutional Sequence to Sequence Learning 论文笔记

sequence

深度学习（BOT方向）学习笔记（1） Sequence To Sequence 学习

【论文笔记】Sequence to Sequence Learning with Neural Networks

Sequence to Sequence Learning with Neural Networks--阅读笔记

Sequence生成唯一的ID

UVM基础-Sequence、Sequencer（一）

在TensorFlow RNN 深度学习下 BiLSTM+CRF 实现 sequence labeling

TensorFlow RNN深度学习 BiLSTM+CRF 实现 sequence labeling 序列标注

TensorFlow RNN深度学习 BiLSTM+CRF 实现 sequence labeling 序列标注源码

论文学习12-Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data（CRF

RxJava 学习笔记<九> 译 Taming the sequence

RxJava 学习笔记 <四> Sequence 基础

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)