distributed representation 之训练词向量的几种方法

其他 2020-01-17 23:53:49 阅读次数: 0

训练词向量时输入一般是1B 即包含10^9个单词(tokens)的一个超长字符串/10B/100B

可以使用的训练模型:
- Skip-Gram(考虑local )
- Glove(同时考虑了local 和 global)
- CBow(效果较差)
- RNN
- LSTM
- MF(Matrix Factorization)(考虑global)
- Gaussian Embedding

可以认为得到的词向量就代表单词的意思???
但训练词向量太耗费资源,一般都有现成的词向量
但垂直领域还需要自己训练

ROOOOOOM

发布了542 篇原创文章 · 获赞 133 · 访问量 15万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/qq_41228218/article/details/103810607

distributed representation 之训练词向量的几种方法

【NLP】2 Distributed Word Representation

词向量的Distributed Representation与n元语法模型(n-gram model)

one-hot representation与distributed representation学习笔记

Distributed representation, Hyperbolic Space, Gaussian/Graph Embedding 详细介绍

TFLearn之Time Distributed

Distributed

Keras/TFLearn 之 Time Distributed

【词向量相关论文】《GloVe: Global Vectors for Word Representation》

启用Ad Hoc Distributed Queries的方法

【总结】Hazelcast之Distributed Map介绍

tensorflow源码解析之distributed_runtime

Build Telemetry for Distributed Services之Jaeger（待续）

Build Telemetry for Distributed Services之OpenTracing实践

Build Telemetry for Distributed Services之OpenTracing文档

『pytorch』Pytorch中的Distributed Data Parallel与混合精度训练（Apex）

Pytorch——distributed单机多卡分布式训练

词嵌入（一）：词汇表征（word representation）

Build Telemetry for Distributed Services之Open Telemetry简介

Build Telemetry for Distributed Services之OpenCensus：C#

mysql官方文档之group replication(18.4.3 Distributed Recovery)

【clickhouse】clickhouse源码 Distributed之表select流程

Distributed Systems

Distributed Requests

distributed trace

Distributed Workflows

Distributed RPC

Distributed TensorFlow

Distributed processing

Distributed Snapshots

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

周排行

决策树的部分理解

STM32软件IIC的实现

RocketMQ原理解析-HA

vue-动态路由（路由的传参和接参）

利用python对Excel中的特定数据提取并写入新表

【Ubuntu】 Ubuntu16.04搭建NFS服务

Elasticsearch基础操作与对应的curl命令行，python对接实现

JVM数据存储结构 & Java的值传递和址传递

yum命令使用指南

java基础（一）：java语法基础

每日归档

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)