语言模型（一）工具和使用简介 - 代码天地

语言模型（一）工具和使用简介

编程语言 2019-04-22 15:40:53 阅读次数: 0

一、常用工具

1. Kenlm https://kheafield.com/code/kenlm/

C++版本，最大特点是速度快、占用内存少

2. Srilm http://www.speech.sri.com/projects/srilm/

SRI（Standford ResearchInstitute）开发，使用比较广泛，c++版本

3. IRSTLM http://sourceforge.net/projects/irstlm/

IRSTLM是意大利TrentoFBK-IRST实验室开发的语言模型训练工具包，其开发的目的是处理较大规模的训练数据

4. MITLM https://code.google.com/p/mitlm/

5. BerkeleyLM https://code.google.com/p/berkeleylm/

Java版本，速度和kenlm差不多，内存比srilm小

参考：

扫描二维码关注公众号，回复： 5973094 查看本文章

http://52opencourse.com/111/斯坦福大学自然语言处理第四课-语言模型（language-modeling）

http://www.52nlp.cn/language-model-training-tools-srilm-details

二、Srilm使用

1. 构建语言模型

【ngram-count】：用于统计ngram的个数和生成最终的语言模型

【ngram-merge】：用于merge多个ngram count文件，适用于内存不足以容下所有语料的情况

2. 语言模型得分

【ngram】：用于语言模型打分、计算困惑度（perplexity）、产生句子和模型插值

3. 语言模型插值

【ngram】：用于语言模型打分、计算困惑度（perplexity）、产生句子和模型插值

4. 语言模型剪枝

三、Srilm使用的文件类型

1. Ngram

最常用的arpa文件，格式如下：

\data\

ngram1=n1

ngram2=n2

...

ngramN=nN

\1-grams:

p w [bow]

...

\2-grams:

p w1 w2 [bow]

...

\N-grams:

p w1 ... wN

...

\end\

2. Classes

基于class的语言模型的格式，如下：

class [p] word1 word2 ...

其中class是语言模型中使用的class name，p是该条class定义的概率，word是该class对应的具体word

3. Psfg

Probabilistic finite-state grammars是一种被SRIDecipher（SRI的解码器）使用的有限状态机。

name name

nodes Nw1 ... wN

initial i

final f

transitionsT

n1 n2 p

...

4. Nbest

用于nbest的重打分

猜你喜欢

转载自blog.csdn.net/qq_44944990/article/details/89452907

语言模型（一）工具和使用简介

语言模型简介

大语言模型简介

一、dubbo的简介和使用

【AI 开源框架】BMTools 是一能让语言模型使用扩展工具的开源仓库

使用kenlm工具训练统计语言模型

Go语言的简介和基本使用

SVN的学习和使用（一）——SVN简介

（一）Flask简介和快速使用

语言模型训练工具SRILM

Linux基本内容介绍(6) -- TCP/IP模型简介，iproute命令使用，进程管理工具介绍以及shell编程until和while的联系

AI之Merlin：Merlin(一款使用ChatGPT和GPT-4的简单且免费的工具)的简介、安装、使用方法之详细攻略

大语言模型综述（六）模型使用

如何开发一个词语级的神经语言模型并使用它生成文本？

科技资讯|下一代Bing搜索,使用比ChatGPT更强大的语言模型

【AI语言大模型】文心一言功能使用介绍

c语言进阶——字符串和一级指针内存模型

一文读懂 ChatGPT 插件功能：语言模型获取新信息的“眼睛和耳朵”

Ziya：一个自回归、双语、开源和多功能的大语言模型

使用RNN训练语言模型

词向量和语言模型

从语言模型到ChatGPT：大型语言模型的发展和应用

LDAP简介，基本模型，安装LDAP,安装和配置LDAP管理工具PHPldapadmin

LLaMA 简介：一个具有 650 亿参数的基础大型语言模型官网介绍

ZFJ开发工具箱-一键JSON转模型工具（支持所有主流语言）

统一建模语言工具PowerDesigner使用

语义解析(一) —— 概述（数据和模型简介）

QT模型/视图简介（一）

JUC--CountDownLatch学习（一）简介和使用

JUC-- CyclicBarrier学习（一）简介和使用

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)