自然语言处理N天-Transformer学习（实现一个Transformer02） - 代码天地

自然语言处理N天-Transformer学习（实现一个Transformer02）

其他 2019-03-08 16:30:51 阅读次数: 0

新建 Microsoft PowerPoint 演示文稿 (2).jpg

这个算是在课程学习之外的探索，不过希望能尽快用到项目实践中。在文章里会引用较多的博客，文末会进行reference。
搜索Transformer机制，会发现高分结果基本上都源于一篇论文Jay Alammar的《The Illustrated Transformer》（图解Transformer），提到最多的Attention是Google的《Attention Is All You Need》。

对于Transformer的运行机制了解即可，所以会基于这篇论文来学习Transformer，结合《Sklearn+Tensorflow》中Attention注意力机制一章完成基本的概念学习；
找一个基于Transformer的项目练手

4.基于Tensorflow实现Transformer

终于，我们来到实现Transformer部分，在这里找的是Github上面的一个338星的项目，基于Keras实现《attention is all you need》，这里分三天搞定吧，最近好累啊，在学校找了个勤工俭学，又做回PPT了……

用法

需要参阅文件是en2de_main.py and pinyin_main.py。
en2de_main.py
使用的数据和Github另一个项目《用pytorch实现Transformer》一致，在存储库中借用了数据预处理步骤0和1，然后构造了输入文件en2de.s2s.txt。
结果：代码在存储库中实现接近结果大约70％的有效准确度。如果使用较小的模型参数，例如layers = 2和d_model = 256，则有效精度更好，因为任务非常小。

使用自己的数据
只需对source sequences和target sequences调整到 en2de.s2s.txt 和 pinyin.corpus.examples.txt。
对于更大数量的层，必须在papar中报告特殊学习速率调度程序。
在pinyin_main.py中，作者尝试了另一种方法来训练深层网络：首先训练第一层和嵌入层，然后训练一个2层模型，然后训练一个3层，等等。它在这个任务中是可行的。

猜你喜欢

转载自blog.csdn.net/weixin_34025051/article/details/88208678

自然语言处理N天-Transformer学习（实现一个Transformer02）

自然语言处理之Transformer

自然语言处理 - Transformer 到 BERT

【自然语言处理】Transformer 讲解

自然语言处理（NLP）——Transformer

【自然语言处理】图解 Transformer

深度学习-自然语言处理(NLP)-Pytorch：Transformer模型源码分析【自定义构建Transformer模型（Copy任务）】

自然语言处理 | (27) Transformer详解1

自然语言处理之------ Model based on Transformer

自然语言处理 | (28) Transformer详解2

自然语言处理 - Self-attention 到 Transformer

自然语言处理（二十）：Transformer规范化层

自然语言处理（二十四）：Transformer模型构建

【自然语言处理】Transformer 模型：概述及分类（综述）

Transformer：革新自然语言处理的强大模型

【自然语言处理】Transformer模型原理和PyTorch实现【文本生成】

人工智能-算法篇50篇-自然语言处理之Transformer模型学习

【自然语言处理 | Transformer】Transformer：Attention is All You Need论文讲解

深度学习-自然语言处理(NLP)-Pytorch：Transformer模型（使用官方模块）构建【根据torch.nn提供的模块搭建自己的Transformer模型】

人工智能 LLM 革命前夜：一文读懂横扫自然语言处理的 Transformer 模型

人工智能 LLM 革命前夜：一文读懂ChatGPT缘起的自然语言处理模型Transformer

一个简单的自然语言处理例子

自然语言处理（二十五）：Transformer与torchtext构建语言模型

完全图解自然语言处理中的Transformer——BERT基础（入门长文）

自然语言处理（二十三）：Transformer解码器构建

自然语言处理（二十二）：Transformer编码器构建

自然语言处理（二十一）：Transformer子层连接结构

自然语言处理（十九）：Transformer前馈全连接层

自然语言处理（十八）：Transformer多头自注意力机制

自然语言处理（二十九）：Transformer与BERT常见问题解析

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)