[学习笔记]词向量模型-Word2vec - 代码天地

[学习笔记]词向量模型-Word2vec

企业开发 2023-09-30 10:33:30 阅读次数: 0

参考资料：
【word2vec词向量模型】原理详解+代码实现
 NLP自然语言处理的经典模型Word2vec

论文背景知识

词的表示方法

One-hot Representation：独热表示

简单，但词越多，向量越长。且无法表示词与词之间的关系。

在这里插入图片描述

论文储备知识-pre-knowledge

语言模型的概念

语言模型是计算一个句子是句子的概率的模型。(语法和语义上)

语言模型的发展

基于专家语法规则的语言模型

语言学家企图总结出一套通用的语法规则，比如形容词后面接名词等。

统计语言模型

在这里插入图片描述

有些词可能没出现在语料中，或者短语太长了。所以概率为0。为了解决这个问题，下面提出统计语言模型中的平滑操作。

统计语言模型中的平滑操作

在这里插入图片描述
但这只解决了词的概率。

为了解决参数空间过大的问题，引入马尔可夫假设。

语言模型的评价指标

每个领域都有自己的评价指标。

语言模型可以看成是多分类问题
开n次方根是为了避免长句子的概率比小句子概率小，导致评价偏颇

在这里插入图片描述

对比模型

NNLM

在这里插入图片描述

语言模型是无监督的，不需要标注语料。

输入层

在这里插入图片描述

能不写成循环，写成矩阵就写成矩阵。能降低复杂度。

隐藏层

在这里插入图片描述

输出层

在这里插入图片描述

Loss

在这里插入图片描述

batchsize是一种tradeoff
由于句子长度不一，所以要补pad，但是最后要去掉

在这里插入图片描述

RNNLM

在这里插入图片描述

word2vec

在这里插入图片描述

多分类下的逻辑回归模型也是Log线性模型。
下面的skip-gram和cbow也都是Log线性模型。

word2vec的原理

在这里插入图片描述

skip-gram

在这里插入图片描述

cbow

在这里插入图片描述

词袋模型，忽略词的顺序。

在这里插入图片描述

关键技术

在这里插入图片描述
需要降低softmax的复杂度。

层次softmax

将softmax计算转化为求sigmoid的计算
写成二叉树的结构
在这里插入图片描述

skip-gram中的层次softmax

在这里插入图片描述

cbow中的层次softmax

在这里插入图片描述

与skip-gram的层次softmax的区别是u0是上下文词向量avg
skip-gram只有一组完整的中心词向量，没法像之前一样将中心词向量和周围词向量相加求平均
cbow只有一组完整的周围词向量

负采样

思想：将多分类转化为二分类问题。
负采样效果比层次softmax要好。

一般采样3-10个负样本

skip-gram负采样

在这里插入图片描述

重要的词往往出现的频率比较小，不重要的词往往出现的频率比较高

CBOW负采样

在这里插入图片描述

重采样

在这里插入图片描述

模型复杂度

在这里插入图片描述

不同模型的E和T认为一样，所以下面用Q来代表模型复杂度。

NNLM

在这里插入图片描述

用层次softmax，V*H会变成 $log_2V*H$

RNNLM

在这里插入图片描述

Skip-gram

在这里插入图片描述

skip-gram负采样

在这里插入图片描述

CBOW

在这里插入图片描述

比较

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/zhangyifeng_1995/article/details/132719661

[学习笔记]词向量模型-Word2vec

Word2Vec模型计算词向量

词向量模型(word2vec) 详解

Word2Vec（词向量）---机器学习

word2vec训练词向量

词向量Word2Vec

word2vec词向量

Word2Vec词向量（一）

使用gensim框架及Word2Vec词向量模型获取相似词

简单粗暴理解与实现机器学习之神经网络NN（四）：词向量-word2vec、Word2Vec模型介绍、统计语言模型、神经网络语言模型NNLMNNLM、Word2Vec案例Word2vec、词向量工具使用

[NLP] 秒懂词向量Word2vec的本质+word2vec资源总结

Python Word2Vec使用训练好的模型生成词向量

自然语言处理词向量模型-word2vec

自然语言处理Word2Vec词向量模型

NLP 利器 Gensim 来训练 word2vec 词向量模型的参数设置

NLP 利器 Gensim 来训练自己的 word2vec 词向量模型

基于词向量word2vec模型的文本分类实现（算例有代码）

神经网络词向量模型之Word2Vec

【自然语言处理】Word2Vec 词向量模型详解 + Python代码实战

自然语言处理-词向量模型-Word2Vec

自然语言处理中传统词向量表示VS深度学习语言模型（三）：word2vec词向量

CS224n课堂笔记2-词的向量表示：word2vec

【CS224n笔记 (2) 】词向量表示word2vec

NLP学习笔记十一-word2vec模型

word2vec是如何得到词向量的

词向量 Word2Vec 修改版

word2vec是如何得到词向量的？

[NLP] 秒懂词向量Word2vec的本质

word2vec 词向量分词效果对比

word2vec词向量训练及gensim的使用

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)