pytorch深入学习（七） - 代码天地

pytorch深入学习（七）

其他 2021-11-29 09:16:28 阅读次数: 0

文章目录

关于RNN和LSTM的介绍可以看我之前的文章：RNN与LSTM

自然语言处理-词向量模型-Word2Vec

在这里插入图片描述

输入两个词，输出一个词语的概率，也就是分类任务，
输入其实用了torch.nn.Embedding层，是顺着索引找到对应的向量，所以embedding的维度很好知道，就是索引×需要的维度，举个例子，假如我们有4个词，每个词想用10维向量表示，那么embedding的维度就是4*10
现在有个问题，假如是多分类任务，如果我的数据中有5w个词，难道最后的输出是5w个吗？

构建训练数据

CBOW和Skip-gram模型

在这里插入图片描述

在这里插入图片描述
Skipgram是输入中间值预测上下文，CBOW是输入上下文预测中间值

负采样方案

在这里插入图片描述

之前提到假如是按多分类来处理会很难，那么就可以转化一下训练方案，原来是输入一个词预测一个词，现在可以变成输入两个词，看看属于上下文的概率值，这样就是个二分类任务，训练数据中满足的target为1
为了满足训练要求，再人为构建target为0的数据，一般5个左右就够了

语言分类任务

先来看一下数据集：

也就是类似新闻标题对应标签，那么对应的每个字的embedding怎么办呢？比如‘我’这个词，假如它对应的是300维向量，那么我们可以有一个文件提前设置好这个参数，不用训练（暂时的理解）
每句话长度不一, 我们可以选取最长的作为标准, 或者选取一个中位数, 太长的截断, 不够的可以用0或者特定的padding字符

猜你喜欢

转载自blog.csdn.net/landing_guy_/article/details/120398323

pytorch深入学习（七）

pytorch深入学习(六)

pytorch深入学习（五）

pytorch深入学习（四）

【傻瓜攻略】深入学习入门之正则化（七）

spring cloud深入学习(七)-----配置中心git示例

深入学习JavaScript系列（七）——Promise async/await generator

深入学习String

Glide深入学习

Dubbo深入学习

深入学习EnumSet

ByteBuffer深入学习

HashMap深入学习

深入学习MongoDB

tomcat深入学习

深入学习consul

jenkins深入学习

myBaits 深入学习

numpy的深入学习

Jobs深入学习

深入学习APC

深入学习 FutureTask

mybatis深入学习

USB深入学习

Spring深入学习

深入学习mybatis

Fragment深入学习

深入学习Golang

Vim的深入学习

RocketMQ深入学习

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

timesten性能问题分析

hdu1017A Mathematical Curiosity

利用FragmentTabHost和ViewPager来实现可滑动切换的页面

哪里找卖百度云资源

大数据技能图谱

PHP设计模式（5）—— 观察者模式

python list删除元素是要注意的坑点

TPM简介

并查集擒贼先擒王//解密犯罪团伙

码农也要修身

每日归档

更多

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)