NLP领域相关的概念整理

分享和整理一些在学习NLP技术时碰到的术语


1. OOV(Out Of Vocabulary)

在自然语言处理或者文本处理的时候,通常会有一个字词库(vocabulary)。这个vocabulary要么是提前加载的(如WordNet语料库),或者是自己定义的,或者是从当前数据集提取的。

假设之后你有了另一个的数据集,这个数据集中有一些词并不在你现有的vocabulary里,我们就说这些词汇是未登录词(Out Of Vocabulary),简称OOV

2. 

不定期更新。。。

猜你喜欢

转载自blog.csdn.net/Ryan_lee9410/article/details/98350747
今日推荐