Angel 实现FFM 一、对于Angel 和分布式机器学习的简单了解 - 代码天地

Angel 实现FFM 一、对于Angel 和分布式机器学习的简单了解

其他 2019-03-08 16:04:42 阅读次数: 0

Angel是腾讯开源的一个分布式机器学习框架。是一个PS模式的分布式机器学习框架。

https://github.com/Angel-ML/angel 这是github地址。

我了解的分布式机器学习概述：

对于分布式机器学习，有些简单的了解，听过一些概念。最近正在看《分布式机器学习算法、理论与实践》这本书，我觉得这本书很不错。一下内容也是我的一个读书总结。

分布式机器学习分为数据和模型划分模块，单机优化模块，通信模块，数据和模型的聚合模块。

分布式机器学习从并行方式来说分为数据并行和模型并行。数据并行是指训练数据规模太大，无法存储在一个节点上，需要把这些数据分配到各个机器上。

数据划分的方式分为对训练样本进行划分和对每个样本的特征维度进行划分。

对训练样本进行划分也分为随机采样法和基于置乱切分的方法。随机采样法是通过有放回抽样，根据每个节点的容量为期分配相应的样本数。这种方式可以保证每个节点的局部数据和整体数据是独立同分布的。但是这么做也有弊端就是如果数据量大，代价比较高。另一个是某些低频的样本可能会在抽样的过程中被遗漏。

另一种是根据基于置乱切分的方法，也就是将样本乱序排列，然后根据每个节点机器的容量，为其分配相应数量的样本。这个方法实现简单，效率相对较高。每个节点在训练的时候仅适用本地数据。在训练一定轮数之后也可以再重新合并数据，重新划分一次。这种方式无限等价于无放回抽样，但是独立同分布的假设是等价于有放回抽样。但是这种方式应该是实际使用比较多的方式。

模型并行，主要是指模型如何在分布式环境下进行并行，是一个节点上包含整个模型还是每个节点只包含一部分模型。主要是线性模型的并行和神经网络的并行。在Angel1.5的LR和FM中模型是保存在参数服务器，每次节点从参数服务器获取所需的一部分参数，在需要更新参数时候将更新的部分推送到参数服务器。深度模型的话一般可以按网络的层次进行划分。

猜你喜欢

转载自www.cnblogs.com/earendil/p/10496218.html

Angel 实现FFM 一、对于Angel 和分布式机器学习的简单了解

angel

Angel 相关学习

腾讯高性能分布式机器学习平台 Angel 2.0.0 发布

腾讯高性能分布式机器学习平台 Angel 2.0.2 发布

腾讯Angel亮相VLDB，携全新Angel 2.0宣布加入LF深度学习基金会

Spark on Angel：Spark机器学习的核心加速器

【技术分享】Spark机器学习的加速器：Spark on Angel

腾讯首个 AI 开源项目 Angel 发布 3.0 版本：迈向全栈机器学习平台

腾讯Andymhuang（黄明）：道器相融，由Angel论一个优秀机器学习平台的自我修养

腾讯首个AI开源项目Angel发布3.0里程碑版本，迈向全栈机器学习平台

principal angel 主角，特征角，以及不变子空间的扰动和相似性问题，以及python代码

基于腾讯Angel的LDA*入选VLDB，超越微软LightLDA

Angel investors accumulated 10,000 in bitcoin slump in 2018

Angel - 模拟Kafka数据流调试FTRL的方法

Angel beats 生命的真正意义（转载，轻微剧透）

秦皇岛站2019CCPC A.Angel Beats

Angel工作室通用权限系统开源发布

深入FFM原理与实践(转载美团点评的文章，准备自己实现一遍FFM)

JS-正则表达式实战篇（Angel著）

流利阅读 2019.3.3 Alita: Battle Angel review—lovestruck tweenies do battle in robot dystopia

腾讯 Angel 成为国内首个从 LF AI 基金会毕业的开源项目

腾讯开源项目Angel从LF AI基金会毕业，成为世界顶级AI项目

腾讯Angel成世界顶级AI项目！中国首个从LF AI基金会的毕业项目

Angel工作室通用权限系统ASP.NET MVC版本发布

Angel工作室精简版企业网站管理系统

计蒜客 39270.Angel's Journey-简单的计算几何 ((The 2019 ACM-ICPC China Shannxi Provincial Programming Contest C.) 2019ICPC西安邀请赛现场赛重现赛

CTR学习笔记&代码实现1-深度学习的前奏LR->FFM

基于asp.net(C#)MVC+前端bootstrap+ztree+lodash+jquery技术-Angel工作室通用权限管理

https://content.ea-tube.com/Alison_Tyler-Femdom_Ass_Worship_17/Alison-Tyler-Evil-Angel-Femdom-Ass-wo

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)