《动手学深度学习》笔记 Task02:文本预处理;语言模型;循环神经网络基础

文本预处理

文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤:

读入文本
分词
建立字典,将每个词映射到一个唯一的索引(index)
将文本从词的序列转换为索引的序列,方便输入模型

语言模型

一段自然语言文本可以看作是一个离散时间序列,给定一个长度为TT的词的序列w1,w2,…,wT,语言模型的目标就是评估该序列是否合理,即计算该序列的概率:

循环神经网络基础

在这里插入图片描述

发布了15 篇原创文章 · 获赞 6 · 访问量 1430

猜你喜欢

转载自blog.csdn.net/qq_39783265/article/details/104315618