实习点滴（7）--《Investigating LSTM for Punctuation Prediction》论文笔记 - 代码天地

实习点滴（7）--《Investigating LSTM for Punctuation Prediction》论文笔记

其他 2018-07-11 10:10:20 阅读次数: 0

原文地址：http://lxie.nwpu-aslp.org/papers/2016ISCSLP-XKT.pdf

本文是利用BiLstm（双向Lstm）+CRF模型，对词组间的标点符号进行预测。

作者首先强调了，递归神经网络(RNN)及其变体在各种序列标签的任务已经显示出优越的性能，例如词性(POS)标签,分块和命名实体识别，韵律边界预测和语言理解。标点符号预测可以被看作是一个典型的序列标签任务。与此同时，作者认为，如果两个都是过去和未来的上下文考虑，标点符号标记更准确；使用一个条件随机域(CRF)层的Lstm可以捕获输出上下文信息,也会有一些性能上的提升。

BiLstm最大的优点在于：它不仅可以利用上一个的信息，还可以利用下一个的信息。

所做的贡献：

1)建议使用双向LSTM(BLSTM)和深度网络架构考虑过去和未来的输入以及模型输入特性和输出标签之间的复杂关系。
2)调查的上下文建模是否输出标点标签,通过CRF层,可以实现对标点符号的预测性能,如预期的那样在其他序列标签的任务。
3)通过研究，得出一个结论：一个2层BLSTM模型可以在标点符号生产最先进的性能预测

模型结构：

算法流程：

对于每个epoch循环：

对于每个batch循环：

(1)BiLstm-CRF正向传播

(2)CRF正向传播

(3)BiLstm-CRF反向传播

(4)更新参数

结束循环batch

结束循环epoch

实验需注意的事项：

(1)在输入前，进行了数据预处理：把问号、感叹号换成句号；把冒号、分号换成逗号（相当于只预测不打标点、逗号和句号三种情况），其他的符号均删除

(2)输入是一句话（经过分词之后的）和这句话中每个词语前的标点符号的label

(3)他们采用的是Mecab-toolkit工具进行分词的

实验结果：

猜你喜欢

转载自blog.csdn.net/sihailongwang/article/details/76147065

实习点滴（7）--《Investigating LSTM for Punctuation Prediction》论文笔记

论文笔记：Investigating LSTM for Punctuation Prediction

《Grammar and Punctuation》课堂笔记

English——Punctuation

PUNCTUATION SYMBOLS

论文笔记：Chinese NER Using Lattice LSTM

论文笔记-深度估计(7)-CNN-SLAM Real-time dense monocular SLAM with learned depth prediction

LSTM笔记

学习笔记（7）- 基于LSTM的对话模型

Vision Transformers for Dense Prediction论文笔记

ICCV 2017 《Online Video Object Detection using Association LSTM》论文笔记

中文实体抽取（NER）论文笔记《Chinese NER Using Lattice LSTM》

阅读理解论文笔记Machine Comprehension Using Match-LSTM and Answer Pointer

[论文笔记]TC-LSTM(Tang D,et al. 2015)

【论文笔记】GENPass：使用RCFG+LSTM和对抗生成网络猜解密码。

【论文笔记】基于CNN+LSTM+GRAPH EMBEDDING 的时空模型预测出行需求

Convolutional_LSTM论文

LSTM学习笔记|Understanding LSTM and its diagrams

【笔记】单向LSTM与双向LSTM对比

论文笔记7：Prioritized Experience Replay

转载LSTM学习笔记

LSTM学习笔记

pytorch笔记：07)LSTM

pytorch的LSTM笔记

RNN、LSTM、GRU笔记

[笔记]RNN和LSTM

LSTM、GRU解析--笔记

RNN+LSTM笔记

LSTM的巅峰理解笔记

实习点滴（9）--LSTM是如何解决RNN中的“梯度消失”

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)