自然语言处理综论-第6章小结-N元语法 - 代码天地

自然语言处理综论-第6章小结-N元语法

其他 2021-04-04 16:54:12 阅读次数: 0

自然语言处理综论-第6章小结-N元语法

本章介绍了N元语法，这是一种年代久远而使用广泛的语言处理实用工具。

N元语法概率是一个单词在前面给定的N-1个单词的条件下的条件概率。N元语法概率可以通过在语料库中简单地计数并使之归一化的方法来进行计算（即最大似然估计），或者也可以通过更复杂的算法来进行计算。N元语法的优点是可以使用丰富的词汇知识，缺点是对训练语料库的依赖性太强。
平滑为估计那些从来不出现的N元语法概率提供了一种较好的解决办法。常用的平滑算法有回退算法、删除插值算法、Witten-Bell打折法和Good-Turing打折法。
评测诸如N元语法这样的基于语料库的语言模型时，要把语料库分为训练集和测试集两部分。在训练集上训练模型，在测试集上评测模型。测试集的熵 $H$ 或困惑度 $2^n$ （更恰当的术语是交叉熵和交叉困惑度）用于对语言模型进行比较。

猜你喜欢

转载自blog.csdn.net/qq_17065591/article/details/108228887

自然语言处理综论-第6章小结-N元语法

自然语言处理综论-第9章小结-英语的上下文无关语法

自然语言处理综论-第10章小结-基于上下文无关语法的剖析

自然语言处理综论-第13章小结-语言的复杂性

自然语言处理综论-第14章小结-意义的表示法

自然语言处理综论-第12章小结-词汇化剖析与概率剖析

自然语言处理综论-第11章小结-特征与合一

自然语言处理综论-第8章小结-词的分类与词类标注

自然语言处理综论-第7章小结-HMM与语音识别

自然语言处理综论-第5章小结-发音与拼写的概率模型

自然语言处理综论-第4章小结-计算音系学与文本-语音转换

自然语言处理综论-第3章小结-形态学与有限状态转录机

自然语言处理综论-第2章小结-正则表达式与自动机

自然语言处理之n元语法模型

学习NLP《自然语言处理综论第2版》中文PDF+英文PDF+对比分析

自然语言处理综论_第二版(中文)_高清pdf网盘下载

自然语言处理期末复习（1）n元模型

《自然语言处理入门》笔记-第1章

第1章自然语言处理简介

自然语言处理: 第十二章LoRA解读

【日常】自然语言处理小结

自然语言处理--N-gram

HanLP《自然语言处理入门》笔记--3.二元语法与中文分词

自然语言处理6 -- 情感分析

【读书笔记】《Python自然语言处理》第1章语言处理与Python

Python自然语言处理第1章语言处理与Python 学习笔记

自然语言处理: 第一章N-Gram

自然语言处理中数学基础（信息论）

自然语言处理中数学基础（概率论）

概率论基础-自然语言处理-笔记

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)