Seq2Seq ---学习笔记 - 代码天地

Seq2Seq ---学习笔记

其他 2019-03-07 15:31:20 阅读次数: 0

应用场景：机器翻译

与language model 不同

MT model 的a<0> 是由encoder 生成的。

language model 的 a<0> 是初始化的。

greedy search

为什么不用 greedy search ?

Beam Search

B=3 的意思是，每次greedy search 选出3个词，然后在根据当前3个词，分别生成下一个词，下一个词也生成3个循环下去。

Beam Search 改进

都是概率，很小的概率相乘，值更小，很多0的，影响精度，不如取个log,

取完log 还有一个问题，这样单纯的概率相乘是倾向于生成短句子的。

因为短句子的概率是最大的。单词越多概率越小。

所以归一化，除以tg的a次方

当a==0 :其实是没有归一化的。

a==1：完全取决于长度。

a 是一个超参数。

beam search 虽然快，但是不能保证结果是正确（概率最大）的。

Beam search 的误差

我们通过分析，要判断是rnn encoder 的误差还是 beam search 的误差，从而决定如如何去改进。

rnn 产生的误差，我们就改善网络。

beam search 的误差，我们可以加大B.

猜你喜欢

转载自www.cnblogs.com/zle1992/p/10489838.html

seq2seq学习

seq2seq学习笔记

Seq2Seq ---学习笔记

seq2seq模型笔记

TensorFlow Seq2Seq Model笔记

深度学习：Seq2seq模型

机器学习面试—seq2seq

深度学习的seq2seq模型

机器学习笔记：seq2seq & attentioned seq2seq

seq2seq and attention模型学习笔记

tensorflow之seq2seq阅读笔记

深度学习之seq2seq简单介绍(待续)

deeplearning.ai学习seq2seq模型

基于Seq2Seq模型的深度学习推荐算法

NLP学习记录5——seq2seq模型

NLP学习(5)----seq2seq/transformer

[DeeplearningAI笔记]序列模型3.1基本的 Seq2Seq /image to Seq

学习笔记CB013: TensorFlow、TensorBoard、seq2seq

学习笔记CB014:TensorFlow seq2seq模型步步进阶

seq2seq编码器与解码器 --学习笔记

NLP学习笔记九-机器翻译-seq2seq模型

Transformer通俗笔记：从Word2Vec、Seq2Seq逐步理解到GPT、BERT

深度学习学习——利用seq2seq做时间序列预测

编码器解码器架构、Seq2Seq简要笔记

深度学习-->NLP-->Seq2Seq Learning(Encoder-Decoder,Beam Search,Attention)

【深度学习篇】--Seq2Seq模型从初识到应用

tensorflow-综合学习系列实例之序列网络(seq2seq)

深度学习项目实战视频-Seq2Seq序列生模型视频

时间序列深度学习：seq2seq 模型预测太阳黑子

【机器学习】【seq2seq模型与attention机制，Beam Search】

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)