《数学之美》读书笔记 - 代码天地

《数学之美》读书笔记

编程语言 2019-03-21 03:02:48 阅读次数: 0

第三章统计语言模型
自然语言从它产生开始，正逐渐演变成一种上下文相关的信息表达和传递的方式，因此让计算机处理自然语言，一个基本的问题就是为自然语言这种上下文相关的特性建立数学模型。

1 用数学的方法描述语言规律普遍描述：假定S表示某一个有意义的句子，由一连串特定顺序排列的词w1,w2,…,wn组成，(这里应该是特征列表)这里n是句子的长度。现在，我们想知道S在文本中出现的可能性，也就是数学熵上所说的S的概率P(S)。

在这里插入图片描述
马尔可夫假设

在这里插入图片描述
2 延伸阅读：统计语言模型的工程诀窍

当前词wi的概率值取决于前面N-1个词，

在这里插入图片描述
上面的假设被称为N-1阶马尔可夫假设，对应的语言模型称为N元模型。N=2就是前面的二元模型。N=1的一元模型实际上是一个上下文无关的模型，N=3在实际中应用最多。

N为什么一般取值都很小？这里主要有两个原因。首先，N元模型的大小（空间复杂度）几乎是N的指数函数，即0(丨V丨N)，这里丨V丨是一种语言词典的词汇量，一般在几万到几十万个。②而使用N元模型的速度（时间复杂度）也几乎是一个指数函数，0(丨V丨N-1）。因此，N不能很大。当N从1到2，再从2到3，效果显著；从3到4，提升就不是很显著了，资源的耗费缺相反。

猜你喜欢

转载自blog.csdn.net/zhaori123/article/details/88702415

《数学之美》读书笔记&思考

数学之美读书笔记(1)

数学之美读书笔记(2)

《数学之美》读书笔记

《数学之美》读书笔记（五）

《数学之美》读书笔记（四）

《数学之美》读书笔记

《数学之美》读书笔记（一）

读书笔记——数学之美

【读书笔记】数学之美2--信息指纹

【读书笔记】数学之美2--分类问题

《数学之美》读书笔记（六）（七）（八）（九）

《数学之美》读书笔记（十）（十一）

读书笔记--读数学之美有感

《架构之美》读书笔记

团队之美 -- 读书笔记

读书笔记 - 算法之美

读书笔记－《深度学习之美》

《系统之美》读书笔记

“数学之美”笔记

数学之美-笔记

【读书笔记】数学之美2-搜索引擎

【读书笔记】数学之美2--从规则到统计

数学之美读书笔记第一章

随笔之读书笔记

读书笔记之Bash

<读书笔记>之《谣言》读书笔记

<读书笔记>之生命的哲学读书笔记

《数学之美》笔记3

《数学之美》笔记4

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)