《自然语言处理宗述》英文版N-gram阅读笔记 - 代码天地

《自然语言处理宗述》英文版N-gram阅读笔记

其他 2018-05-30 03:17:51 阅读次数: 0

第四章

N-gram模型：用前面的N-1个词去预测第N个词的概率的模型。并且这种预测第N个词的模型。N指的是句子中的连续N个词。最终显示他与预测一系列词出现的概率相似。

4.2 simple(unsmoothed)N-grams

我们的目标是计算在给定一些内容h,来计算词w出现的概率，即P(w | h).比如计算P(the | its water is so transparent that),

方法一:统计词典中所有句子，计算出ite … that句子后面跟的是the的数目，然后除以总数。

方法二：如下，在h条件的w出现的概率，可以理解为h+w一起出现的概率，然后运用概率论的链式法则，推理如下:

链式法则实现了一个句子的联合概率分布和条件概率分布之间的链接。上式表明了我们可以用一系列的条件概率分布来等价的估计出联合概率分布。颗粒理解为对于单词W，我们并不是一下全部给他所有的h知识，而是一步一步的只给他前一个词。
这里说markov assumption(马尔科夫假设)是一个词出现的概率只依赖与他前面的那个词
方法三:所以这里引出了第三个模型bigram model,只用前一个单词来预测（也就是N-gram里面的N等于2）。具体公式如下:

**方法四:**trigram 指的是N等于3，用前面的两个词来进行预测。
N-gram model，N=1,为unigram model；N=2为bigram model;N=3为trigram model.

猜你喜欢

转载自blog.csdn.net/u010995990/article/details/79788920

《自然语言处理宗述》英文版N-gram阅读笔记

自然语言处理--N-gram

自然语言处理NLP中的N-gram模型

自然语言处理中的N-Gram模型

N-gram模型(自然语言处理)

自然语言处理中的N-Gram模型详解

自然语言处理入门学习笔记1：从朴素贝叶斯到语言模型N-gram

python 自然语言处理统计语言建模 - （n-gram模型）

自然语言生成之n-gram

NLP task2 _ 自然语言处理中N-Gram模型的Smoothing算法

人工智能自然语言处理：N-gram和TF-IDF模型详解

自然语言处理: 第一章N-Gram

2020-3-2 深度学习笔记12 - 深度学习应用 3（自然语言处理NLP - n-gram / 神经语言模型NNLM / 高维输出 / 结合 n-gram 和神经语言模型 / 神经机器翻译）

《自然语言处理（哈工大关毅 64集视频）》学习笔记：第五章 n-gram语言模型

通俗讲：自然语言处理（NLP）入门之N-gram语言模型。（朴素贝叶斯分类器的推导）

自然语言处理（NLP）： 03 tfidf 特征抽取&n-gram 扩展 + 朴素贝叶斯模型

【Chatgpt4 教学】 NLP（自然语言处理）第十一课 n-gram模型原理

MATLAB算法实战应用案例精讲-【深度学习】自然语言处理模型N-Gram

人工智能-算法篇49篇-自然语言处理之N-gram模型学习

自然语言处理学习笔记（英文）

《精通Python自然语言处理》高清中文版PDF+高清英文版PDF+源代码

N-gram 语言模型

N-gram语言模型

人工智能-自然语言处理(NLP)：N-gram语言模型【用来判断一句话语法上是否通顺】 --＞语言模型的评估【Perplexity（困惑度） --＞利用语言模型生成新句子】

(五)N-gram语言模型的数据处理

DeepLearning笔记: 语言模型和 N-gram

《精通Python自然语言处理》高清中文版+英文版PDF+源代码完整版免费下载

基于python的自然语言处理分类和标注词汇之5.5N-gram标注

N-gram语言模型 & Perplexity & 平滑

n-gram语言模型及平滑算法

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)