【NLP_Stanford课堂】语言模型2 - 代码天地

【NLP_Stanford课堂】语言模型2

其他 2018-08-07 19:46:41 阅读次数: 0

一、如何评价语言模型的好坏

　　标准：比起语法不通的、不太可能出现的句子，是否为“真实”或"比较可能出现的”句子分配更高的概率

　　过程：先在训练数据集上训练模型的参数，然后在测试数据集上测试模型的效果。

　　要求：测试数据集与训练数据集完全不同

　　评价指标：用以评价模型的测试数据集上的效果

二、N-gram 模型的外部评测

1. 比较两个模型最好的评价方法：

将两个模型A和B应用于同一个任务：拼写检查、语音识别、机器翻译等
运行这个任务，分别得到A和B的准确性：有多少个拼写错误的单词被恰当的纠正了？或者有多少单词被准确翻译了？
比较A和B的准确率，哪个更高，哪个模型就更好

2. 难点

非常耗时，可能需要好几天甚至几个星期

三、N-gram 模型的内部评测

由于外部评测会非常耗时，所以我们有时候采用内部评测，也就是perplexity，其不需要任何其他的应用，只依赖于模型本身。

但是perlexity对于外部评测来说非常不好，除非测试数据跟训练数据非常相似，所以其一般只适用于预实验（中间实验）。

例1：预测下一个单词时，模型的表现如何？

当要求预测以上内容时，一个好的模型应该给实际上出现的答案分配更高的概率。

发现：unigrams在这个任务上非常不好。

一个最好的模型应该是能在非可见的测试数据集上预测最准的那个模型，即在给出的所有句子的概率中正确的句子的概率最高。

定义：Perplexity是测试数据集上的概率矩阵，并用来单词数做了归一化

要求：最小化perplexity，即PP(W)。实质上，跟要求最大化概率是一样的。

例2：识别数字‘0,1,2,3,4,5,6,7,8,9’有多难？

比如以上这个任务的perplexity就是10

定义：Perplexity是带权重的分支因子。

验证：

假定有一个句子是由N个随机数字组成，每个数字的概率是1/10，那么

猜你喜欢

转载自www.cnblogs.com/a-present/p/9438957.html

【NLP_Stanford课堂】语言模型2

【NLP_Stanford课堂】语言模型

【NLP_Stanford课堂】语言模型4

【NLP_Stanford课堂】文本分类2

【NLP_Stanford课堂】拼写校正

【NLP_Stanford课堂】文本分类

【NLP_Stanford课堂】正则表达式

【NLP_Stanford课堂】词形规范化

nlp(2)语言模型

Stanford NLP

Stanford NLP

【NLP】play with stanford nlp

中文 NLP（6）-- stanford 训练词性标注模型

nlp 统计语言模型

NLP语言模型

NLP（四）：语言模型

NLP之语言模型

NLP《语言模型》

NLP（三）——语言模型

Stanford NLP 解读 ACL 2018 论文——用于调试 NLP 模型的语义等价对立规则

NLP预训练语言模型

NLP-统计语言模型

NLP的特征表达-语言模型

NLP基础——语言模型（LM）

【自然语言处理（NLP）】基于Word2Vec的语言模型实践

stanford NLP 介绍与安装,使用

网易云微专业课NLP总结：2.语言模型：通顺度模型与智能纠错（2. 统计语言模型与神经语言模型构建）

C语言课堂笔记2

NLP task2 _ 自然语言处理中N-Gram模型的Smoothing算法

自然语言处理（NLP）：06 word2vec训练中文模型-文本分类

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)