seq2seq中的beam search - 代码天地

seq2seq中的beam search

编程语言 2018-09-02 03:57:28 阅读次数: 0

因工作需要，最近在疯狂补充自然语言处理和语音识别的知识，内容多为转载，转的内容使我这个小白比较容易理解，大牛可以忽略。。。。

转自：https://www.sohu.com/a/159397046_206784

首先说明在sequence2sequence模型中，beam search的方法只用在测试的情况，因为在训练过程中，每一个decoder的输出是有正确答案的，也就不需要beam search去加大输出的准确率。

假设现在我们用机器翻译作为例子来说明。

我们的任务是翻译中文“我是中国人”--->英文“I am Chinese”

假设我们的词表大小只有三个单词就是I am Chinese。

那么如果我们的beam size为2的话，我们现在来解释,

如下图所示，我们在decoder的过程中，有了beam search方法后，在第一次的输出，我们选取概率最大的"I"和"am"两个单词，而不是只挑选概率最大的单词。

然后接下来我们要做的就是，把“I”单词作为下一个decoder的输入算一遍得到y2的输出概率分布，把“am”单词作为下一个decoder的输入算一遍也得到y2的输出概率分布。

比如将“I”单词作为下一个decoder的输入算一遍得到y2的输出概率分布如下：

扫描二维码关注公众号，回复： 3006338 查看本文章

比如将“am”单词作为下一个decoder的输入算一遍得到y2的输出概率分布如下：

那么此时我们由于我们的beam size为2，也就是我们只能保留概率最大的两个序列，此时我们可以计算所有的序列概率：

“I I” = 0.4*0.3 "I am" = 0.4*0.6

"I Chinese" = 0.4*0.1 "am I" = 0.5*0.3

"am am" = 0.5*0.3 "am Chinese" = 0.5*0.4

我们很容易得出俩个最大概率的序列为 “I am”和“am Chinese”，然后后面会不断重复这个过程，直到遇到结束符为止。

最终输出2个得分最高的序列。

猜你喜欢

转载自blog.csdn.net/Suan2014/article/details/82178263

seq2seq中的beam search

关于seq2seq中的beam search

Seq2Seq+Attention+Beam Search

深度学习-->NLP-->Seq2Seq Learning(Encoder-Decoder,Beam Search,Attention)

RNN聊天机器人与Beam Search [Tensorflow Seq2Seq]

【机器学习】【seq2seq模型与attention机制，Beam Search】

pytorch seq2seq闲聊机器人beam search返回结果

seq2seq model: beam search和attention机制理解

序列到序列学习 seq2seq 束搜索 beam search 动手学深度学习v2

Seq2Seq

Seq2Seq中的Attention详解

seq2seq模型

tensorflow seq2seq

seq2seq attention

seq2seq学习

seq2seq理解

seq2seq原理

PyTorch: SEQ2SEQ

seq2seq 函数

『RNN』SEQ2SEQ

seq2seq、attention

Greedy search与beam search

Beam Search

TensorFlow中seq2seq库函数

seq2seq中对文本数据的处理

tensorflow中的seq2seq的代码详解

Seq2Seq中的Attention和self-attention

Seq2Seq中Exposure Bias现象的浅析与对策

Seq2Seq原理2

seq2seq的实现方式（2）

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)