使用与未使用预训练词向量的区别 - 代码天地

使用与未使用预训练词向量的区别

业界资讯 2023-09-30 04:14:55 阅读次数: 0

预训练词向量

对于训练数据较少的情况下，使用预先训练好的词向量可以使一些目前可解释或不可解释的先验词语信息嵌入到词向量中，而这些先验知识对于下游词向量训练任务，尤其是小数据集来讲很有帮助。预训练词向量的选择主要考虑两个因素：语料和维度。

语料选择需要与训练数据的文本类型保持一致，例如英文对应英文预训练集，中文对应中文预训练集，新闻文本最好对应新闻文本的预训练集。
预训练词向量的维度要和自定义的词向量维度保持一致。

(一) 目的

通过已训练好的词与词/字与字之间的相关性特征（上下文语言结构）来适用于与之类似的上下文特征，弥补训练数据不足以学习出该语言结构的一般特点。

(二) 使用与未使用预训练词向量的区别

使用预训练词向量将表征具有该预训练词与词关系的语义信息；
随机生成初始化词向量不能通过特定上下文单词的出现来预测target词；
也就是说，如果训练数据中出现该预训练集中存在上下文单词，就可以在之后的神经网络训练后生成一个准确的taget，不需要再反向传播更新传入的权重值，否则需要不断更新权重参数来实现梯度下降到最低点找到最优值。（实际上预训练词向量可以简化梯度下降<模型收敛>的过程，个人理解）

猜你喜欢

转载自blog.csdn.net/weixin_53952878/article/details/128009314

使用与未使用预训练词向量的区别

在Keras模型中使用预训练的词向量

如何使用“预训练的词向量”，做文本分类

pytorch中如何使用预训练词向量

PyTorch在NLP任务中使用预训练词向量

使用Keras和预训练的词向量训练新闻文本分类模型

使用gensim训练词向量

Glove预训练词向量

神经网络 Embedding层理解； Embedding层中使用预训练词向量

使用 rnn 训练词向量模型

使用genism训练词向量【转载】

Keras中加载预训练的词向量

极简使用︱Gemsim-FastText 词向量训练与使用

极简使用︱Glove-python词向量训练与使用

word2vec词向量训练及gensim的使用

Pytorch求索(3)：使用训练好的词向量

使用github--stanfordnlp--glove训练自己的数据词向量

使用wiki中文数据训练词向量模型

Python word2vec训练词向量，电子病历训练词向量，超简单训练电子病历的词向量，医学电子病历词向量预训练模型

词向量使用技巧

glove 词向量使用

各种预训练的词向量(Pretrained Word Embeddings)

NLP之分词、词向量、预训练篇

word2vec预训练词向量

自然语言处理从入门到应用——动态词向量预训练：ELMo词向量

bert作为词向量的使用

BERT预训练模型字向量提取工具--使用BERT编码句子

机器学习笔记 - 使用预训练词嵌入进行文本相似性分析

caffe | 预训练模型的使用

训练词向量

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)