NLP中的语言模型(language model) - 代码天地

NLP中的语言模型(language model)

其他 2018-09-25 15:46:26 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/huanghaocs/article/details/77935556

什么是语言模型

本文参考维基百科语言模型 language model
统计语言模型是一个单词序列上的概率分布，对于一个给定长度为m的序列，它可以为整个序列产生一个概率 $P(w_1,w_2,...,w_m)$ 。其实就是想办法找到一个概率分布，它可以表示任意一个句子或序列出现的概率。
目前在自然语言处理相关应用非常广泛，如语音识别(speech recognition) , 机器翻译(machine translation), 词性标注(part-of-speech tagging), 句法分析(parsing)等。传统方法主要是基于统计学模型，最近几年基于神经网络的语言模型也越来越成熟。

Unigram models

Unigram models也即一元文法模型，它是一种上下文无关模型。该模型仅仅考虑当前词本身出现的概率，而不考虑当前词的上下文环境。概率形式为 $P(w_1,w_2,...,w_m)=P(w_1)*P(w_2)*...*P(w_m)$ ，即一个句子出现的概率等于句子中每个单词概率乘积。
以一篇文档为例，每个单词的概率只取决于该单词本身在文档中的概率，而文档中所有词出现的概率和为1，每个词的概率可以用该词在文档中出现的频率来表示，如下表中

Terms	Probability
a	0.1
world	0.2
likes	0.05
we	0.03
share	0.26
…	…

对于这篇文档中，所有概率和相加为1，即 $\sum P(term) = 1$

n-gram models

n-gram models也即n元语言模型，针对一个句子 $w_1,w_2,...,w_m$ 的概率表示如下：

P (w 1, w 2, . . ., w m) = \prod i = 1 m P (w i | w 1, . . ., w i - 1) = \prod i = 1 m P (w i | w i - (n - 1), . . ., w i - 1)

$P(w_1,w_2,...,w_m)= \prod_{i=1}^{m}P(w_i|w_1,...,w_{i-1})=\prod_{i=1}^{m}P(w_i|w_{i-(n-1),...,w_{i-1}})$ 这里可以理解为当前词的概率与前面的n个词有关系，可以理解为上下文有关模型。n-gram模型中的条件概率可以用词频来计算

P (w i | w i - (n - 1), . . ., w i - 1) = c o u n t ( w i - ( n - 1 ) , . . . , w i - 1 , w i c o u n t ( w i - ( n - 1 ) , . . . , w i - 1 )

$P(w_i|w_{i-(n-1)},...,w_{i-1})=\frac{count(w_{i-(n-1)},...,w_{i-1},w_i}{count(w_{i-(n-1)},...,w_{i-1})}$

Neural language models

神经语言模型使用连续表示或词汇Embedding来进行预测。已神经网络为基础来训练模型。
这里未完待续。。。

猜你喜欢

转载自blog.csdn.net/huanghaocs/article/details/77935556

NLP中的语言模型(language model)

语言模型（language model）

了解语言模型Model Language，NLP必备

【NLP】3 Language Model

NLP、language model、lstm、attention model

线上学习-语言模型 language model

Language Model

序列模型之语言模型（Language model）简记

统计语言模型(Statistical Language Model)-学习笔记

Model 模型

模型（Model）

模型Model

django中model模型

Django中的模型（model）

自然语言处理从入门到应用——自然语言处理的语言模型（Language Model，LM）

language model and RNN

RNN Language Model 详解

【深度学习】：Language Model

Neural Network Language Model

A Neural Probabilistic Language Model

Language Model perplexity by using tensorflow使用tensorflow RNN模型计算语言模型的困惑度

[NLP论文阅读]A Neural Knowledge Language Model（一）

NLP 3.5 Transformer的结构，BERT&masked language model

NLP | 词袋模型 Bag of words model

NLP subword model

【Language model】使用RNN LSTM训练语言模型写出45°角仰望星空的文章

语言模型（预训练与词向量）第二篇-NNLM（Nerual Network Language Model）

论文阅读：A Neural Probabilistic Language Model 一种神经概率语言模型

SIMVLM：简单视觉语言模型，SIMPLE VISUAL LANGUAGE MODEL PRETRAINING WITH WEAK SUPERVISION

【预训练语言模型】WKLM: Pretrained Encyclopedia: Weakly Supervised Knowledge-Pretrained Language Model

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)