Sequence to Sequence Learning with Neural Networks 论文理解

其他 2021-03-20 19:29:52 阅读次数: 0

0. 说明

序列到序列映射数据学习建模, 使用深度神经网络

https://ai.deepshare.net/detail/p_5d54e025bab7d_EUVqzfFX/6

30 篇精度论文中的一篇, 好好理解下, 为甚么 LSTM 的结构, 能够建模语言/语音模型

1. Abstract

深度神经网络（DNN）是功能强大的模型，已在困难的学习任务上取得了出色的表现。尽管DNN在大型标签训练集可用时都能很好地工作，但是它们不能用于将序列映射到序列。在本文中，我们提出了一种通用的端到端序列学习方法，该方法对序列结构进行了最小限度的假设 (a general end-to-end approach to sequence learning that makes minimal assumptions on the sequence structure) 。我们的方法使用多层Long Short-TermMemory（LSTM）将输入序列映射到固定维数的向量，然后使用另一个深度LSTM从向量解码目标序列。我们的主要结果是，在来自WMT'14数据集的英语到法语的翻译任务中，LSTM产生的翻译在整个测试集上的BLEU得分达到34.8，其中LSTM的BLEU得分对词汇量以外的单词进行了惩罚。另外，LSTM在长句子上没有困难。为了进行比较，基于短语的SMT系统在同一数据集上的BLEU得分达到33.3。当我们使用LSTM对上述SMT系统产生的1000个假设进行重新排序时，其BLEU得分提高到36.5，接近该任务先前的最佳结果。 LSTM还学习了对词序敏感并且对主动和被动语音相对不变的明智的短语和句子表示。最后，我们发现反转所有源句子（而不是目标句子）中单词的顺序可以显着提高LSTM的性能，因为这样做会在源句子和目标句子之间引入许多短期依赖性，从而使优化问题更加容易

猜你喜欢

转载自blog.csdn.net/u013625492/article/details/114826314

Sequence to Sequence Learning with Neural Networks 论文理解

论文复现Sequence to sequence learning with neural networks

【论文阅读】Sequence to Sequence Learning with Neural Networks

Sequence to Sequence Learning with Neural Networks

【Deep Learning】Sequence to Sequence Learning with Neural Networks

【论文笔记】Sequence to Sequence Learning with Neural Networks

Sequence to Sequence Learning with Neural Networks阅读笔记

Paper Reading - Sequence to Sequence Learning with Neural Networks

【论文】Sequence to sequence learning with neural netwoks

【论文阅读】Sequence to Sequence Learning with Neural Network

Sutskever2014_Sequence to Sequence Learning with Neural Networks

Sequence to Sequence Learning with Neural Networks--阅读笔记

NMT十篇必读论文（九）Sequence to Sequence Learning with Neural Networks

【每周一文】Sequence to Sequence Learning with Neural Networks（2014）

Gated Graph Sequence Neural Networks

《GATED GRAPH SEQUENCE NEURAL NETWORKS》结合代码的论文阅读笔记

论文笔记：Pervasive Attention: 2D Convolutional Neural Networks for Sequence-to-Sequence Prediction

Implicitly-Defined Neural Networks for Sequence Labeling

Graph-to-Sequence Learning using Gated Graph Neural Networks读书笔记

Convolutional Sequence to Sequence Learning 论文笔记

Convolutional Sequence to Sequence Learning

Convolutional Sequence to Sequence Learning 论文笔记 Convolutional Sequence to Sequence Learning 论文笔记

论文笔记：Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling

Sequence Models(Week1)---Recurrent Neural Networks

Note - Sequence models - Recurrent Neural Networks (deeplearning.ai)

【论文阅读】Incorporating copying mechanisim in sequence-to-sequence learning

Convolutional Sequence to Sequence Learning翻译

读论文：Deep Neural Networks with Multitask Learning

《Bag of Freebies for Training Object Detection Neural Networks》论文理解

Non-local Neural Networks论文理解

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)