GloVe模型的理解及实践（1） - 代码天地

GloVe模型的理解及实践（1）

其他 2018-11-10 18:25:40 阅读次数: 0

一、GloVe模型的理解

1）原理

功能：基于语料库构建词的共现矩阵，然后基于共现矩阵和GloVe模型对词汇进行向量化表示

输入：语料库　　输出：词向量

2）与Skip-Gram、CBOW模型比较

例如：句子为"dog barked at the mailman" ，目标单词为'at'

Skip-gram模型：Skip-gram模型只关注单个输入/输出元组中的目标词和上下文中的单个单词，输入为["dog", "at"]

CBOW模型：关注目标单词和单个样本中上下文的所有单词，则输入为[["dog","barked","the","mailman"],"at"]

因此，在给定数据集中，对于指定单词的上下文而言，CBOW比Skip-gram会获取更多的信息。Global Vector融合了矩阵分解的全局统计信息和上下文信息。

3）步骤

1.构建共现矩阵

例如句子为：i love you but you love him i am sad
包括7个单词：i、love、you、but、him、am、sad

设context = 5，则目标单词的左右长度都为2，以下为统计窗口：

注：中心词为目标单词，窗口内容为目标单词的左右各两个单词。

扫描二维码关注公众号，回复： 4013142 查看本文章

如："i"左边无单词，右边有两个单词"love","you",所以窗口内容为["i","love","you"]

设：语料句子长度为n，共现矩阵为 $X$ ，n*n维的矩阵，矩阵元素为 $X_{i,j}$

$X_{i,j}$ 表示在整个语料库中，单词 $i$ 和单词 $j$ 出现在同一个窗口中的次数。

如中心词为“you”(下标为2)，context单词为“i、love、but、you”

（下标分别为0,1,3,4），则执行：

$X_{2,0}+=1$

$X_{2,1}+=1$

$X_{2,3}+=1$

$X_{2,4}+=1$

再重复以上步骤，将整个语料库遍历一遍。

2.使用GloVe模型训练词向量

代价函数为

下一篇文章为Glove工具的具体实现。

参考：https://blog.csdn.net/codertc/article/details/73864097

猜你喜欢

转载自blog.csdn.net/qq_33373858/article/details/83684473

GloVe模型的理解及实践（1）

GloVe模型的理解及实践（2）

理解GloVe模型

理解GloVe模型（+总结）

Glove模型的理解和推导

理解GloVe模型（Global vectors for word representation）

ELMo模型的理解与实践（1）

glove模型

NLP学习（1）---Glove模型---词向量模型

Glove模型的原理与代码

词向量-Glove理解推导

GloVe----模型与损失函数

gensim导入glove模型的方法

词向量：GloVe 模型详解

ELMo模型的理解与实践（2）

HAN模型理解1

gensim加载Glove预训练模型

ARMR模型简单实践（1）

Glove（Global vectors for word representation）原理理解

（十五）通俗易懂理解——Glove算法原理

四步理解GloVe！(附代码实现)

[DeeplearningAI笔记]序列模型2.8 GloVe词向量

CS224n笔记三之词向量模型与GloVe

词嵌入模型浅析——Word2vec与glove

Ubuntu下GloVe中文词向量模型训练

word2vec 和 glove 模型的区别

Keras深度学习实战——使用GloVe模型构建单词向量

深度学习实践学习1——线性模型

贝叶斯模型的理解（1）

1 JVM内存模型的个人理解

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)