flair embedding--《Contextual String Embeddings for Sequence Labeling》阅读笔记 - 代码天地

flair embedding--《Contextual String Embeddings for Sequence Labeling》阅读笔记

其他 2020-02-23 21:05:46 阅读次数: 0

这篇文章主要是提出了一种embedding方法。

首先作者介绍了现有sota的embedding方法：

classical word embedding，在超大语料上预训练；
character-level features，在领域内的数据集上训练，以捕捉任务相关的subword特性；
情境化的embedding，捕捉一些多义词和任务相关的词；

作者提出了一种上下文字符embedding，以期能够融合上述三种sota embedding的特性，提出的这种上下文字符embedding随后被送入下游的sequence labeling任务中，比如说BiLSTM+CRF，整个模型的架构如下：

主要贡献是在最下层的character language model那块，具体实现方式见下图：

就是分别从前往后和从后往前对一个词建模，比如说上图中的Washington这个词，首先是获取Washington最后一个字母"n"的隐层状态，然后从后往前，获取到“w”这个字母的隐层表征，将这两部分的状态concat起来，即：

实验部分，作者分别在NER、chunking、POS等任务上，做了很多的尝试，实验结果见下：

下一步阅读下这篇文章的代码。

发布了117 篇原创文章 · 获赞 8 · 访问量 5万+

私信关注

猜你喜欢

转载自blog.csdn.net/u014257192/article/details/103225687

flair embedding--《Contextual String Embeddings for Sequence Labeling》阅读笔记

论文阅读笔记：《Contextual String Embeddings for Sequence Labeling》

工具篇Flair之训练自己的Flair Embeddings

sequence labeling笔记（一）

Task 4: Contextual Word Embeddings

【论文阅读】Topical Word Embeddings

Sequence Models(Week2)---Natural Language Processing & Word Embeddings

Note - Sequence models - NLP and Word Embeddings (deeplearning.ai)

Sequence Labeling Problem

Sequence to Sequence Learning with Neural Networks阅读笔记

An Empirical Study on Leveraging Position Embeddings for TOWE 论文阅读笔记

文献阅读笔记 # SimCSE: Simple Contrastive Learning of Sentence Embeddings

文献阅读 - From Word Embeddings To Document Distances

论文阅读 DEFT: Detection Embeddings for Tracking

ELMo（Embeddings from Language Models） --学习笔记

Question Answering with Subgraph Embeddings【论文笔记】

【论文笔记】Question Answering with Subgraph Embeddings

Coursera, Deep Learning 5, Sequence Models, week2, Natural Language Processing & Word Embeddings

李宏毅机器学习课程笔记8：Structured Learning - Linear Model、Structured SVM、Sequence Labeling

深度学习笔记——理论与推导之Structured Learning【Sequence Labeling Problem】（八）

番外.李宏毅学习笔记.ST4.Sequence Labeling

Sequence to Sequence Learning with Neural Networks--阅读笔记

学习：Bi-LSTM-CRF for Sequence Labeling

Implicitly-Defined Neural Networks for Sequence Labeling

论文阅读：《a simple but tough-to-beat baseline for sentence embeddings》

【论文阅读】A Correlated Topic Model Using Word Embeddings

How Contextual are Contextualized Word Representations in BERT、ELMO and GPT-2 Embeddings

String源码阅读笔记

【论文阅读】Sequence to Sequence Learning with Neural Network

【论文阅读】Sequence to Sequence Learning with Neural Networks

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)