深度学习使用word embedding(词嵌入)的原因 - 代码天地

深度学习使用word embedding(词嵌入)的原因

其他 2018-10-30 22:51:14 阅读次数: 0

版权声明：转载请声明转自Juanlyjack https://blog.csdn.net/m0_38088359/article/details/83352939

1、基于神经网络的词分布表示，将单词映射到低维连续向量

词嵌入编码了语义空间中的线性关系，向量不同部分表示不同的语义。比如“国王-往后”与“男-女”的类比反映中语义空间的线性关系。

2、相似词映射到了相似方向，语义相似性被编码

近义词或者“相似”词的邻居词分布类似，同样两个词邻居词分布类似可以推出两个词语义相近。比如 “猫宠物主人喂食蹭喵 ” 和 “狗宠物主人喂食咬汪”这两组词可以推出 v(“猫”)≈v(“狗”)。

3、（优点的角度）

（1）对比one-hot高维稀疏向量，embedding维度低，连续向量，方便模型训练；
（2）一个向量可以编码一词多义（歧义需要另外处理）；
（3）天然有聚类后的效果；
（4）罕见词也可以学到不错的表示。

附录：浅析word2vec

连续词袋模型Continous Bag of Words Model(CBOW)和Skip-Gram Model。CBOW根据某个词前面的C个词或者前后C个连续的词，来计算某个词出现的概率。Skip-Gram Model相反，是根据某个词，然后分别计算它前后出现某几个词的各个概率。以“我爱北京天安门”这句话为例。假设我们现在关注的词是“爱”，C＝2时它的上下文分别是“我”，“北京天安门”。CBOW模型就是把“我” “北京天安门” 的one hot表示方式作为输入，也就是C个1xV的向量，分别跟同一个VxN的大小的系数矩阵W1相乘得到C个1xN的隐藏层hidden layer，然后C个取平均所以只算一个隐藏层。这个过程也被称为线性激活函数。然后再跟另一个NxV大小的系数矩阵W2相乘得到1xV的输出层，这个输出层每个元素代表的就是词库里每个词的事后概率。输出层需要跟ground truth也就是“爱”的one hot形式做比较计算loss。这里需要注意的就是V通常是一个很大的数比如几百万，计算起来相当费时间，除了“爱”那个位置的元素肯定要算在loss里面，word2vec就用基于huffman编码的Hierarchical softmax筛选掉了一部分不可能的词，然后又用nagetive samping再去掉了一些负样本的词所以时间复杂度就从O(V)变成了O(logV)。Skip gram训练过程类似，只不过输入输出刚好相反。

猜你喜欢

转载自blog.csdn.net/m0_38088359/article/details/83352939

深度学习使用word embedding(词嵌入)的原因

词嵌入 word embedding

词嵌入（word embedding）

词嵌入（word embedding）简记

词嵌入word embedding详解

词向量词嵌入 word embedding

AI（009） - 词嵌入（Word Embedding）

NLP（六）：word embedding（词嵌入）

词嵌入（Word Embedding）原理详解

embedding 深度学习词嵌入，词预测，情绪分析

自然语言处理：什么是词嵌入(word embedding)？

【NLP-01】词嵌入的发展过程(Word Embedding)

关于词嵌入（Word Embedding）的一些总结

one-hot（独热）、bag of word（词袋）、word-Embedding（词嵌入）浅析

Word Embedding:词嵌入，是指将词或其他符号表示为实数向量。

深度学习(六) Word Embedding

[DeeplearningAI笔记]序列模型2.1-2.2词嵌入word embedding

14、【李宏毅机器学习（2017）】Unsupervised Learning: Word Embedding（无监督学习：词嵌入）

机器学习的基础——embedding词嵌入&相似性&聚类算法介绍

词嵌入embedding

深度学习中的Embedding（嵌入）层

深度理解嵌入(embedding)层

NLP：word embedding词嵌入/word2vec词向量方法(一种主流的分布式表示)的简介、案例应用之详细攻略

From Word Embedding to Sentence Embedding:从词向量到句向量

词嵌入(Word embeddings)

Keras—embedding嵌入层的使用

word embedding怎么处理未登录词

学习词嵌入（Learning Word Embeddings）

深度学习笔记09-词嵌入和word2vec(NLP领域)

深度学习-nlp系列（4）：Word2Vec 字&词向量的训练和使用

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)