【NLP】词向量之fastText原理

其他 2019-07-10 15:05:14 阅读次数: 0

1. fastText和word2vec的区别

相似处：

图模型结构很像，都是采用embedding向量的形式，得到word的隐向量表达。
都采用很多相似的优化方法，比如使用Hierarchical softmax优化训练和预测中的打分速度。

不同处：

模型的输出层：word2vec的输出层，对应的是每一个term，计算某term的概率最大；而fasttext的输出层对应的是分类的label。不过不管输出层对应的是什么内容，起对应的vector都不会被保留和使用。
模型的输入层：word2vec的输出层，是 context window 内的term；而fasttext 对应的整个sentence的内容，包括term，也包括 n-gram的内容。

两者本质的不同，体现在 h-softmax的使用：

Word2vec的目的是得到词向量，该词向量最终是在输入层得到，输出层对应的 h-softmax
也会生成一系列的向量，但最终都被抛弃，不会使用。
fastText则充分利用了h-softmax的分类功能，遍历分类树的所有叶节点，找到概率最大的label（一个或者N个）

2. 总结

fastText是一个能用浅层网络取得和深度网络相媲美的精度，并且分类速度极快的算法。按照作者的说法“在标准的多核CPU上，能够训练10亿词级别语料库的词向量在10分钟之内，能够分类有着30万多类别的50多万句子在1分钟之内”。但是它也有自己的使用条件，它适合类别特别多的分类问题，如果类别比较少，容易过拟合。

转载自：https://www.cnblogs.com/huangyc/p/9768872.html

猜你喜欢

转载自blog.csdn.net/zkq_1986/article/details/93201706

【NLP】词向量之fastText原理

FastText词向量表示

NLP︱高级词向量表达（二）——FastText（简述、学习笔记）

无所不能的Embedding2 - 词向量三巨头之FastText详解

[NLP]高级词向量表达之GloVe详解

[NLP]高级词向量表达之ELMo详解

[NLP]高级词向量表达之WordRank详解

NLP复习之【使用飞桨构造生成词向量】

【NLP面试QA】词向量

[NLP]文本分类之fastText详解

NLP系列文章：子词嵌入(fastText)的理解！(附代码)

李沐第十七课《词向量-Glove和fastText》

极简使用︱Gemsim-FastText 词向量训练与使用

词向量训练原理

词表征 3：GloVe、fastText、评价词向量、重新训练词向量

TensorFlow与NLP（词向量：skip-gram）

【NLP】词向量的惊人力量

NLP--词向量与相关应用(七)

NLP基础笔记5——词向量

05[NLP训练营]词向量

【NLP】_03_基础词向量

nlp(1)skip-gram词向量

词向量之Word2vector原理浅析

【NLP】之 Word2vec(将评论转为词向量)

NLP自然语言处理之Word2Vec(一）词向量

NLP进阶之（六）Word2Vec+FastText+Glove

NLP自然语言处理之GloVe与fastText

Fasttext原理

NLP—fastText、CNN

NLP之tfidf作词向量

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)