企业中实现分布式算法的架构_20210119

其他 2021-01-29 09:47:29 阅读次数: 0

我们平时学习的机器学习和深度学习算法都是加载在单机的内存中进行的，企业中当数据量很大时使用的是分布式的模式。

机器学习怎么实现分布式：

1.spark中的MLlib中有一些机器学习的算法，但是这些算法的实现和sklearn是完全不一样的，因为他是要卡考虑分布式的。
以逻辑回归为例，在计算梯度的时候，是将数据加载到n个机器的内存中的，MLlib会将一个batch分为n份到每个机器上计算一个梯度，然后再将这些梯度平均。
xgboost是有再spark中集成的，
2.MLlib中没有，依赖于spack的手写算法，使用pyspack或者scala来写
3.MLlib中没有，不依赖于spack的手写算法，依赖hadoop集群使用mapreduce，mapreduce可以理解为一个大的shell脚本，这个脚本可以使用多种语言进行来写，这个大脚本里有两个脚本，一个map,一个reduce,然后将shell脚本传递给部署了hadoop的客户端，然后客户端帮助分发，分发的内容先为mapper,将同一个用户的数据放到同一台机子上，然后执行reduser,作用是将执行的结果存起来。

具体是看企业使用的是哪种。

深度学习

深度学习常用的工具，tf和torch，他们会提供分布式的API;
很多公司还有自己开发的GPU集群，GPU集群就类似于CPU集群中的hadoop.

猜你喜欢

转载自blog.csdn.net/a18829292719/article/details/112852990

企业中实现分布式算法的架构_20210119

faunaDB的分布式架构：如何在分布式架构中实现faunaDB的分布式架构

SOAP架构中如何实现分布式事务?

分布式、微服务、云架构、分布式大型互联网企业架构！

分布式架构的几种实现方式

谈谈分布式架构中的CAP

Zookeeper在分布式架构中的应用

分布式大型互联网企业架构！

分布式大型互联网企业架构

JavaEE企业级分布式高级架构

整合spring cloud云架构 --spring cloud分布式系统中实现分布式锁

【分布式架构】企业级分布式应用服务EDAS使用攻略

【分布式架构】什么是企业级分布式应用服务

分布式架构

memcache 分布式，算法实现

分布式限流算法及实现介绍

分布式系统中的哈希算法

分布式架构系统中分布锁的实现

zookeeper中的从选paxos和fast paxos算法到实现分布式锁和分布式队列

企业大型互联网分布式架构{Java分布式架构 dubbo + springmvc + mybatis + ehcache + redis }

分布式算法

shiro权限控制（二）：分布式架构中shiro的实现

微服务分布式架构中，如何实现日志链路跟踪？

微服务分布式架构中，如何实现优雅发版？

大型分布式网站架构（一）负载均衡算法

架构 - 分布式 - 分布式锁的几种实现方式

ES的分布式架构原理（ES如何实现分布式）

分布式架构下基于Redisson实现Redis分布式锁

大型分布式网站架构：缓存在分布式系统中的应用

[分布式系统] [作业] Consul架构中的分布式系统理论应用

今日推荐

周排行

回表和覆盖索引

设计模式-template method

GLES3.0中文API-glDrawElements

Java中类之间的关系

iPhone应用提交流程：如何将App程序发布到App Store

关于c内联函数不能有循环递归

移动端点击事件、滑动不可用的坑~~

16，SSH远程登录服务

SqlDataReader C#数据库查询结果数据

痴情研究java内存中的对象

每日归档

更多

2024-06-17(0)

2024-06-16(0)

2024-06-15(0)

2024-06-14(0)

2024-06-13(0)

2024-06-12(0)

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)