机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习 - 代码天地

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

其他 2018-07-09 20:17:58 阅读次数: 0

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

加载库

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

作者使用 help.py 加载数据，同时使用 project_test.py 测试函数。

数据

该数据集包含一个相对较小的词汇表，其中 small_vocab_en 文件包含英文语句，small_vocab_fr 包含对应的法文翻译。

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

预处理

我们将使用以下预处理方法将文本转化为整数序列：

1. 将词转化为 id 表达；

2. 加入 padding 使得每个序列一样长。

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

Padding

通过使用 Keras 的 pad_sequences 函数在每个序列最后添加零以使得所有英文序列具有相同长度，所有法文序列具有相同长度。

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

预处理流程

实现预处理函数：

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

模型

在本节中，我们将尝试各种神经网络结构。我们将训练 4 个相对简单的结构作为开始：

模型 1 是一个简单的 RNN；
模型 2 是一个带词嵌入的 RNN；
模型 3 是一个双向 RNN；
模型 4 是两个 RNN 组成的编码器—解码器架构。

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

模型 1：RNN

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

我们构建一个基础的 RNN 模型，该模型是将英文翻译成法文序列的良好基准。

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

基础 RNN 模型的验证集准确度是 0.6039。

模型 2：词嵌入

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

词嵌入是在 n 维空间中近义词距离相近的向量表示，其中 n 表示嵌入向量的大小。我们将使用词嵌入来构建一个 RNN 模型。

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

嵌入式模型的验证集准确度是 0.8401。

模型 3：双向 RNN

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

双向 RNN 模型的验证集准确度是 0.5992。

模型 4：编码器—解码器框架

编码器构建一个语句的矩阵表示，而解码器将该矩阵作为输入并输出预测的翻译。

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

编码器—解码器模型的验证集准确度是 0.6406。

模型 5：自定义深度模型

构建一个将词嵌入和双向 RNN 合并到一个模型中的 model_final。

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

预测

def final_predictions(x, y, x_tk, y_tk):

tmp_X = pad(preproc_english_sentences)

model = model_final(tmp_X.shape,

preproc_french_sentences.shape[1],

len(english_tokenizer.word_index)+1,

len(french_tokenizer.word_index)+1)

model.fit(tmp_X, preproc_french_sentences, batch_size = 1024, epochs = 17, validation_split = 0.2)

y_id_to_word = {value: key for key, value in y_tk.word_index.items()}

y_id_to_word[0] = '<PAD>'

sentence = 'he saw a old yellow truck'

sentence = [x_tk.word_index[word] for word in sentence.split()]

sentence = pad_sequences([sentence], maxlen=x.shape[-1], padding='post')

sentences = np.array([sentence[0], x[0]])

predictions = model.predict(sentences, len(sentences))

print('Sample 1:')

print(' '.join([y_id_to_word[np.argmax(x)] for x in predictions[0]]))

print('Il a vu un vieux camion jaune')

print('Sample 2:')

print(' '.join([y_id_to_word[np.argmax(x)] for x in predictions[1]]))

print(' '.join([y_id_to_word[np.max(x)] for x in y[0]]))

final_predictions(preproc_english_sentences, preproc_french_sentences, english_tokenizer, french_to

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

我们得到了语句完美的翻译同时验证集准确度是 0.9776！

进群：125240963 即可获取数十套PDF哦！

猜你喜欢

转载自blog.csdn.net/qq_42156420/article/details/80970295

机器学习很神秘，入门Python神经机器翻译！这篇最适合新手学习

【深度学习机器翻译】GNMT：Google 的的神经机器翻译系统

这 7 门编程语言最适合新手学习

最适合新手学习Vue的案例：商品添加到购物车的功能

最适合小白学习的人工智能机器学习课程

最适合小白学习的人工智能+机器学习视频教程

用强化学习做神经机器翻译

深度学习入门（六十三）循环神经网络——机器翻译数据集

Python机器学习：适合新手的8个项

良心推荐！数学建模基础知识-MATLAB快速上手，最适合新手学习的Matlab快速入门教程

最适合入门的编程语言——python

最适合新手入门的SpringCloud教程 6—Ribbon负载均衡「F版本」

最适合新手入门的SpringCloud教程 7—OpenFeign「F版本」

【机器翻译】今日入门的一个记录对偶学习及其在机器翻译中的应用

这才是最适合新手的python教程（最新版python3.11）

《基于共同学习对齐和翻译的神经机器翻译》论文阅读

Python Web开发—基础入门目前最适合Python入门的视频教程系统学习Python

利用Python获取操作系统信息实例！最适合新手操作的项目！

这才是最适合新手的python基础教程，640页超详细

入门Python神经机器翻译，这是一篇非常精简的实战指南

机器学习新手使用入门

机器学习之新手入门

NLP学习笔记（七）神经网络机器翻译（NMT）

R语言深度学习实战：机器翻译与神经网络

《动手学习深度学习》之二：机器翻译（打卡2.1）

NMT：神经网络机器翻译

神经机器翻译中的Attention机制

神经机器翻译（NMT）开源工具

神经网络机器翻译技术

神经网络机器翻译科普

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)