论文阅读：《Visual Dialog》 - 代码天地

论文阅读：《Visual Dialog》

其他 2018-10-31 06:51:24 阅读次数: 0

论文：https://arxiv.org/pdf/1611.08669.pdf
原文：http://www.hankcs.com/nlp/cs224n-visual-dialog.html

术语Visual Dialog，大致这么翻译（通俗理解为斗图）。你可以给聊天机器人发送图片，它能理解图片的意思，你们可以就图片内容展开对话；除了文本之外，让图片也成为交流的一部分；这可以帮助盲人理解周围或社交媒体上的信息。

这是自然语言处理与计算机视觉的交叉应用。

hankcs.com 2017-06-21 下午1.54.35.png

相关工作

已经有很多工作在为图像和文本搭建桥梁了。

图像视频自动标题

hankcs.com 2017-06-21 下午1.57.00.png

虽然效果有限，比如右边这只猫实际上在与一只貂戏耍，而不是一个玩具。

图像语义对齐

也就是将一个图片中的各个物体自动框出来，自动输出物体之间的语义联系：

hankcs.com 2017-06-21 下午2.01.15.png

图像QA

这种应用已经快要接近图像对话了，只不过QA系统一般是独立的一问一答，而且机器给出的答案一般很短：

hankcs.com 2017-06-21 下午2.04.02.png

贡献

这篇文章提出了这么一种新的任务：图像对话。

然后开发了一个双人对话协议，整理了一个数据库。

介绍了一系列用于图像对话的神经网络模型。

技术细节

用于处理图像的CNN，用于处理问题的LSTM，和另一个用于处理历史对话内容的LSTM：

hankcs.com 2017-06-21 下午2.09.47.png

也没讲细节的东西。

数据集

数据集如下图左边所示：

hankcs.com 2017-06-21 下午2.11.47.png

hankcs.com 2017-06-21 下午2.11.44.png

右边是与QA数据集的对比，可见比起QA数据集，VD的答案所含词语数更多，没有唯一答案的问题更多。

结果

有一些量化结果（但是没讲，应该是前多少个答案的准确率之类的标准）：

hankcs.com 2017-06-21 下午2.15.05.png

猜你喜欢

转载自blog.csdn.net/u011239443/article/details/83352163

论文阅读：《Visual Dialog》

Visual Dialog 论文阅读笔记

[visual dialog相关论文阅读]Two Causal Principles for Improving Visual Dialog

【一】情感对话 Towards Emotional Support Dialog Systems 论文阅读

dialog

【Qt文档阅读】Window and Dialog Widgets

《论文阅读》Autoregressive Entity Generation for End-to-End Task-Oriented Dialog

论文《Unsupervised Dialog Structure Learning》笔记：详解DD-VRNN

【论文阅读】Action Recognition Using Visual Attention

论文阅读：PVO: Panoptic Visual Odometry

[论文阅读]Visual Attention Network原文翻译

Jquery Dialog

dialog activity

好吧~dialog

重写dialog

Dialog的使用

Dialog 样式

android Dialog

好多Dialog

easyui 的dialog

PopupWindow与Dialog

ligerUI的dialog

dialog学习

圆角的Dialog

easyui的dialog

MFC Dialog

java Dialog

flutter dialog

Dialog的用法

dialog全屏

今日推荐

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

“开源信徒”周鸿祎开源360智脑大模型

周排行

VS2017编译opensmile具体过程和遇到的问题

PowerEnglish——mini-story3总结

微信小程序数据库获取字符串在view中显示换行

Java静态代码块/构造代码块/构造函数/静态变量/成员变量(相关示例)

Keras使用tensorflowjs部署demo

window下用git连接Github

图象的全变分和去噪

LeetCode刷题笔记--119. Pascal's Triangle II

【Linux】进程间通信 - 管道

polyA|ribo-minus|differentiated cell|Genetic heterogeneity

每日归档

更多

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)