【Transformer】学习过程记录

企业开发 2023-06-18 19:45:42 阅读次数: 0

Transformer

算法结构
代码解读

论文来源：Attention Is All You Need
程序源码来源：github中的demo

算法结构

根据论文的给出的图片，我们不难模仿着画出算法的简要结构。

对于更加细致的各个模块功能以及上面给出demo的数据在模型中shape的变化过程，还可以看下面这张图：

代码解读

拿到这个demo后，首先确定一下这个程序的输入是什么，输出是什么，要解决的是什么问题。

通过一步步的debug代码调试，不难发现，输入是[2, 3, 4, 5, 2, 4, 9, 7, 6, 10, 5]这样的整数列表。而且这里的列表长度默认是15（训练数据encoder输入是15，decoder输入是14），列表中的值位于[2, 11)之间。这里的范围与长度都是有一定的意义的，我们把每一个列表看成一个句子，每个整数值当作一个字，则这里15表示一个句子的长度为15，而11的限制暗示这些句子中会有11种不同的字。
这个demo程序的任务就是要通过[2, 3, 4, 5, 2, 4, 9, 7, 6, 10, 5]这样的输入，推出[ 3, 4, 5, 2, 4, 9, 7, 6, 10, 5]这样的输出，更直观的来说就是略去最开头的字符。输入数据shape(15)，而输出数据shape(14)。

参考博客与网络资源：
[1]: Transformer代码完全解读(附有可实验的完整训练推理程序)
[2]: Transformer算法完全解读
[3]: NLP基础知识点：BLEU（及Python代码实现)
[4]: 十分钟读懂Beam Search 1：基础

猜你喜欢

转载自blog.csdn.net/weixin_50006912/article/details/130971259

【Transformer】学习过程记录

transformer学习笔记+详细记录

Deep Homography with Transformer实验学习记录

PVT(Pyramid Vision Transformer)学习记录

学习Transformer（The Illustrated Transformer）

开始记录学习过程

记录matlab学习过程

学习过程的记录与思考

记录自己的学习过程

mysql的学习过程记录

记录php的学习过程

【OUC深度学习入门】第6周学习记录：Vision Transformer & Swin Transformer & ConvNeXt

transformer的学习记录【完整代码+详细注释】（系列七）

transformer的学习记录【完整代码+详细注释】（系列六）

transformer的学习记录【完整代码+详细注释】（系列五）

transformer的学习记录【完整代码+详细注释】（系列四）

transformer的学习记录【完整代码+详细注释】（系列三）

transformer的学习记录【完整代码+详细注释】（系列二）

transformer的学习记录【完整代码+非常详细】（系列一）

transformer及动手学习transformer

记录LaTeX学习过程_02

记录下前端学习过程

记录LaTeX学习过程_03

记录LaTeX学习过程_01

【tensorflow】tensorflow学习过程记录

mysql存储过程学习记录

dm crypt学习过程记录

开通博客，记录学习过程

FPGA学习过程记录一

记录我的php学习过程

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)