深入浅出XDL（二）：embedding - 代码天地

深入浅出XDL（二）：embedding

其他 2020-01-25 10:26:53 阅读次数: 0

XDL(X-DeepLearning)是阿里巴巴开源的一款深度学习框架。官方介绍，此框架针对广告、推荐、搜索的场景做了很多优化。

广告、推荐和搜索的模型，一个重要的特点是存在大量的稀疏特征，为此xdl提供了稀疏API:

API
xdl.embedding	计算单路稀疏特征的embedding
xdl.merged_embedding	同时计算多路稀疏特征的embedding，内部将通信和计算做了合并，建议embedding较多时使用

本文对XDL的稀疏特征API的实现做个简单的分析。

xdl.embedding

此API属于Python层的, 用于计算单路稀疏特征的embedding
在这里插入图片描述
API的Python代码主要用于构建embedding网络，可以看出构建的embedding网络主要由三种节点构成：

Variable节点
Sparse Pull节点
Combiner节点，支持三种合并方式(sum, mean, tile)

通过xdl.embedding代码的分析，并没有看到参数是如果分配的，实际上关键的逻辑在XDL实现的几个自定义Op中，这点非常类似与tensoflow

PsRegisterVariableOp

参数申请Op，对应Python层的接口为xdl.ps_register_variable_op
在这里插入图片描述

可以看出，此Op被调用的时候，并没有实际的去请求参数服务器创建参数，下面的查询Op中可以看到，实际的创建请求要等到查询时刻。

PsSparsePullOp

在这里插入图片描述

如果变量没有申请，则立即请求参数服务器创建参数
底层与参数服务器的通信通过seastar
需要注意的是，PsSparsePullOp其实并不是tensorflow Op，而是继承自XDL自定义的一套Op，并且XDL自定义了一套graph runtime framework。所以XDL的模型会有两个Graph，一个是tensroflow的Graph，另一个是XDL的graph，关于这两个Graph如果交互，tensor如何在两个graph间流动，不是本文重点，以后独立分析。
以上xdl.embedding接口创建的graph，是XDL自定义的graph，并非tensorflow的graph
XDL采用这种方案的原因，个人的猜测，是为了降低对tensorflow的依赖，方便将tensorflow替换为其他的后端训练框架

PsPullOp

在这里插入图片描述

查询参数值Op

jony0917

发布了52 篇原创文章 · 获赞 105 · 访问量 7万+

私信关注

猜你喜欢

转载自blog.csdn.net/gaofeipaopaotang/article/details/100904138

深入浅出XDL（二）：embedding

深入浅出XDL（三）：framework

深入浅出XDL（四）：模型训练

深入浅出XDL（一）：Blaze推理引擎

《深入浅出Embedding》随笔

【Transformer系列】深入浅出理解Embedding（词嵌入）

深入浅出Mybatis（二）

深入浅出 JAVA NIO（二）

Git Pro深入浅出（二）

深入浅出redis(二)

MySQL——深入浅出索引（二）

CSS深入浅出（二）

Nacos深入浅出（二）

深入浅出git(二)——分支

深入浅出MySQL索引（二）

Android 深入浅出AIDL（二）

深入浅出SynchronousQueue队列（二）

深入浅出Pytorch(二）

深入浅出：大语言模型中必不可少的技术——Embedding简介

深入浅出SOA 深入浅出SOA

深入浅出Mybatis

深入浅出 Retrofit

深入浅出SOA

深入浅出JMS

深入浅出parallelStream

深入浅出Swarm

深入浅出ClassLoader

深入浅出JVM

深入浅出Netty

深入浅出REST

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)