pytorch nn.Embedding()原理

企业开发 2023-05-04 15:18:52 阅读次数: 0

Word Embedding

Word embedding 是将自然语言中的词语映射为实数向量的一种技术，通常通过机器学习算法从文本数据中学习得到。其基本思想是将每个词语映射到高维空间中的一个向量，使得词语在语义上相似的向量在空间中距离较近，从而能够将自然语言中的词语转化为计算机能够处理的数值型数据。Word embedding 技术在自然语言处理、机器翻译、信息检索等领域得到了广泛应用。常见的 Word embedding 方法有 CBOW（Continuous Bag-of-Words）、Skip-gram 和 GloVe 等。

nn.Embedding

为什么使用嵌入层

1、使用One-hot 方法编码的向量会很高维也很稀疏。假设我们在做自然语言处理（NLP）中遇到了一个包含2000个词的字典，当使用One-hot编码时，每一个词会被一个包含2000个整数的向量来表示，其中1999个数字是0，如果字典再大一点，这种方法的计算效率会大打折扣。

2、训练神经网络的过程中，每个嵌入的向量都会得到更新。通过上面的图片我们就会发现在多维空间中词与词之间有多少相似性，这使我们能可视化的了解词语之间的关系，不仅仅是词语，任何能通过嵌入层 Embedding 转换成向量的内容都可以这样做。

参数

num_embeddings - 词嵌入字典大小，即一个字典里要有多少个词。
embedding_dim - 每个词嵌入向量的大小。

import torch

embedding=torch.nn.Embedding(10,10)
for i in range(10):
    print(i)
    tensor=torch.tensor(i)
    output=embedding(tensor)
    print(output)

参考：

经常提到的Embedding层有什么用？ | 机器之心 (jiqizhixin.com)

猜你喜欢

转载自blog.csdn.net/qq_40107571/article/details/130462878

pytorch nn.Embedding()原理

pytorch nn.embedding

【pytorch】nn.Embedding()

【PyTorch】nn.Embedding

pytorch实现word embedding: nn.Embedding

pytorch复习笔记--nn.Embedding()的用法

深度学习：pytorch nn.Embedding详解

Pytorch常用的函数(二)pytorch中nn.Embedding原理及使用

【pytorch】有关nn.EMBEDDING的简单介绍

Pytorch nn.Embedding用法（包括加载预训练模型，加载Word2vec,加载glove）

nn.Embedding

nn.Embedding使用

【Pytorch：nn.Embedding】简介以及使用方法：用于生成固定数量的具有指定维度的嵌入向量embedding vector

torch.nn.Parameter()，nn.Embedding()

pytorch中，嵌入层torch.nn.embedding的计算方式

PyTorch之 torch.nn.Embedding 词嵌入层的理解

【Pytorch基础教程28】浅谈torch.nn.embedding

pytorch embedding层详解（从原理到实战）

pytorch embedding层详解（从原理到实战）

pytorch的Embedding使用

PyTorch中的Embedding层

pytorch torch.nn

pytorch:nn.BatchNormal

pytorch:nn.Softmax()

（pytorch进阶之路）四种Position Embedding的原理及实现

pytorch中的nn.Bilinear的计算原理详解

转：PyTorch实现word embedding

Pytorch：嵌入层Embedding、EmbeddingBag

Pytorch-nn.Module-modules()

pytorch中nn.linear

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)