自然语言处理学习 - Word2vec基础数学篇 - 代码天地

自然语言处理学习 - Word2vec基础数学篇

其他 2018-05-24 19:07:25 阅读次数: 0

【转载】机器学习算法实现解析——word2vec源码解析 --- 作者：zhiyong_will
【转载】word2vec 中的数学原理详解（一）目录和前言 --- 作者：peghoty
【转载】word2vec数学原理
【转载】word2vec有什么应用？--- 来自知乎各位大牛现身说法
【转载】[NLP] 秒懂词向量Word2vec的本质 --- 知乎穆文『数据挖掘机养成记』
【转载】word2vec Parameter Learning Explained --- 作者：Xing rong

预备知识

sigmoid函数、逻辑回归、Bayes公式
Huffman树& Huffman编码、统计语言模型、n-gram模型（词出现概率与前面固定数目词相关）
神经概率语言模型（利用词向量，利用神经网络构造F）、与n-gram模型的对比优势（输入层到投影层累加非首位拼接、无隐藏层、输出层为树形结构非线性）
词向量的理解（与One-hot的区别，One-hot维度太高，不能表示相似性）、基于Hierarchial Softmax的模型：CBOW(Continuous Bag-of-Words model) & Skip-gram (Continuous skip-gram model)、对比神经概率语言模型与CBOW模型
梯度计算（随机梯度上升）求最大概率值推导、最终得到Xw、q、g、e、θ， CBOW伪代码 & Skip-gram伪代码
基于Negative Sampling 的模型：CBOW (Continuous Bag-of-Words model) & Skip-gram (Continuous skip-gram model)

数学推导对应上方6点

1) sigmoid函数、逻辑回归、Bayes公式

2) Huffman树 & Huffman编码、统计语言模型、n-gram模型（词出现概率与前面固定数目词相关）

3) 神经概率语言模型（利用词向量，利用神经网络构造F）、与n-gram模型的对比优势（输入层到投影层累加非首位拼接、无隐藏层、输出层为树形结构非线性）
4) 词向量的理解（与One-hot的区别，One-hot维度太高，不能表示相似性）、基于Hierarchial Softmax的模型：CBOW(Continuous Bag-of-Words model) & Skip-gram (Continuous skip-gram model)、对比神经概率语言模型与CBOW模型

5) 梯度计算（随机梯度上升）求最大概率值推导、最终得到Xw、q、g、e、θ， CBOW伪代码 & Skip-gram伪代码

6) 基于Negative Sampling 的模型：CBOW (Continuous Bag-of-Words model) & Skip-gram (Continuous skip-gram model)

# 后期应该补上 Word2vec的源码解读：

#

猜你喜欢

转载自blog.csdn.net/sinat_15355869/article/details/80013346

自然语言处理学习 - Word2vec基础数学篇

自然语言处理学习 - NLTK 预热篇

【自然语言处理】word2vec/doc2vec基础学习以及简单实践

自然语言处理word2vec

自然语言处理之word2vec

自然语言处理--Word2vec

自然语言处理--Word2vec（二）

自然语言处理（3）——Word2Vec理论

浅谈自然语言处理中的word2vec

自然语言处理 - word2vec

人工智能-算法篇43篇-自然语言处理之Word2Vec学习

自然语言处理——word2vec项目实战——从Word2Vec到FastText

Word2Vec学习笔记之基础篇

Word2Vec学习笔记之基础篇

深度学习----自然语言处理之Word2Vec原理

自然语言处理学习2：英语分词1word_tokenize, WordPunctTokenizer, TreebankWordTokenizer , WhitespaceTokenizer等

NLP自然语言处理学习（三）——Seq2Seq模型

【自然语言处理（NLP）】基于Word2Vec的语言模型实践

Word2Vec —— 深度学习的一小步，自然语言处理的一大步

TensorFlow 系列案例（2）：自然语言处理-TensorFlow + Word2Vec

自然语言处理词向量模型-word2vec

利用Tensorflow进行自然语言处理（NLP）系列之一Word2Vec

利用Tensorflow进行自然语言处理（NLP）系列之二高级Word2Vec

自然语言处理之word2vec原理词向量生成

自然语言处理Word2Vec词向量模型

Python自然语言处理—词嵌入 word2vec

干货｜自然语言处理中的词向量 — word2vec！

自然语言处理（NLP）：04 word2vec 入门介绍

自然语言处理（NLP）：04 word2vec 入门介绍

自然语言处理（NLP）：06 word2vec训练中文模型-文本分类

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)