【王小草NLP相关论文积累】语言的生成 - 代码天地

【王小草NLP相关论文积累】语言的生成

其他 2018-06-04 03:53:00 阅读次数: 2

注：本文内容非作者笔记，是作者平时看公众号的论文推送与介绍（比如paperweekly, 哈工大SCIR等），觉得不错的，有空可以精度的NLP相关的论文，将他们复制整理在本文中，以便之后有需要时回顾。

本文的论文主要是自然语言生成相关的论文。

来源：哈工大SCIR
推荐人：孙卓（研究方向：文本生成）
论文题目： Review Networks for Caption Generation
作者： Zhilin Yang, Ye Yuan, Yuexin Wu, Ruslan Salakhutdinov, William W. Cohen
出处： NIPS 2016
论文主要相关：review network、描述生成
简评：传统的encoder-decoder模型有以下两个问题：一、其attention机制是以顺序的方式作用，缺少全局建模能力；二、在decoder进行到某t时刻时，产生的token仅仅基于当前attention的结果，无法参考未来attention结果信息的问题。考虑到这些问题，本文提出了一种新型的模型。
与传统的带有attention的encoder-decoder模型相比，本文提出的模型包含三个部分：encoder、reviewer、decoder。其中的reviewer在encoder端的隐层上进行多次的基于attention的review操作，得到一些thought向量（f1~fTr），这些thought向量（f1~fTr）被用来在decoder端进行attention，其中基于attention的review操作的步数Tr为超参数。本文提出了两种reviewer：attentive input reviewer和attentive output reviewer。除此之外，本文也使用了discriminative supervision（预测在caption中出现的词），可以使reviewer学习到的thought向量更趋近于预测到图片中出现的词。论文结构清晰，其思考方式值得借鉴。
论文链接：
https://arxiv.org/pdf/1605.07912.pdf
源代码链接：
https://github.com/kimiyoung/review_net

猜你喜欢

转载自blog.csdn.net/sinat_33761963/article/details/80162533

【王小草NLP相关论文积累】语言的生成

【王小草NLP相关论文积累】语言的表征

NLP相关论文综述

NLP生成论文

如何查找NLP相关论文

王小草【机器学习】笔记--提升

NLP+VS=>Image Caption︱自动生成图像标题技术论文+相关项目2

[ NLP ] 自然语言处理必读论文

「自然语言处理(NLP)论文推送」会话响应生成（含源码）【美国卡耐基梅隆大学】

NLP相关的语言学基础

自然语言处理深度生成模型相关资源、会议和论文分享

【自然语言处理NLP】DPCNN模型论文精读笔记

NLP相关

「自然语言处理(NLP)论文推送」（中文诗歌生成）&& 上下文增强Transformer【ACL && 微信AI团队 && 北交】

自然语言（NLP）发展史及相关体系

1.8 【王小草深度学习笔记】RNN的梯度弥散 Vanishing gradients with RNNs

09[NLP训练营]基于语言模型生成句子

【NLP论文分享 && 摘要生成】长文本摘要生成/提取（曼彻斯特大学&&含源码）

前端积累----图片相关

Linux相关知识积累

nodejs爬虫相关积累

nodejs 开发相关积累

eslint 相关积累

Maven相关知识积累

积累-gis相关

sklearn相关积累

webpack相关点积累

NLP论文套路备忘

NLP面对论文

NLP 论文领读｜文本生成模型退化怎么办？SimCTG 告诉你答案

今日推荐

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

对话Kaldi之父、小米首席语音科学家Daniel Povey：开源环境比金钱和荣誉更吸引我 | AGI技术50人...

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

阅读送书抽奖？玩转抽奖游戏，js-tool-big-box工具库新上抽奖功能

百度发布Comate代码知识增强2.0，国内首个支持实时检索智能代码助手

黑客利用扫雷游戏 Python 克隆隐藏恶意脚本，攻击欧洲和美国金融机构

微软对开源字体 Cascadia Code 进行重大更新

好书推荐《ChatGPT原理与架构：大模型的预训练、迁移和中间件编程》

Baidu Comate 智能编码助手：编程新伙伴，效率新飞跃

AI时代：人工智能大模型引领科技创造新时代

百篇博客 · 千里之行

周排行

Python模块之shelve

勇于承担责任

Hikyuu 1.1.0 发布，量化交易研究框架

字节跳动Java3面“凉凉”~不负韶华，努力复习备战“金三银四”

Linux下静态链接库与动态链接库的区别

spring boot架构改造

怎么理解AOP

文件不同步 --本地和eclipse

在linux配置nginx负载均衡

Linux Shell基础命令

每日归档

更多

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)