深度学习_1_神经网络_4_分布式Tensorflow

其他 2019-11-07 22:17:26 阅读次数: 0

分布式Tensorflow

单机多卡（gpu）

多级多卡（分布式）

自实现分布式

API：

1，创建一个tf.train.ClusterSpec，用于对集群的所有任务进行描述，该描述对于所有任务相同

2，tf.train.Server 创建ps，worker 并运行相应的计算任务

cluster=tf.train.ClusterSpec({"ps":ps_spec,"worker":worker_spec})

ps_spec = ["ps0.example.com:port","ps2.example.com:port"] 对应 /job:ps/task:0,1

worker_spec=["worker0.example.com:port",...] /job:worker/task:10
tf.train.Server(server_orcluster,job_name,task_index=None,protocol_None,config=None,start=True) 创建服务
- server_or_cluster：集群描述
- job_name:任务类型名称
- task_index:任务数
- attributes:target 返回tfSession连接到此服务器的目标
- method：join() 参数服务器，直到服务器等待接收参数任务关闭
tf.device(device_name_or_function)
- 选择指定设备或者设备函数
- if device_name
  - 指定设备
  - 例如 “/job:worker/tsak:0/cpu:0
- if function
  - tf.train.replica_device_setter(worker_device=worker_device,cluster=cluster)
  - 作用：通过此函数协调不同设备上的初始化操作
  - worker_device:为指定设备，“job/worker/task:0/cpu:0" or "/job:worker/task:0/gpu:0"
  - cluster:集群描述对象
- 使用with tf.device() 使不同工作节点在不同设备上

猜你喜欢

转载自www.cnblogs.com/Dean0731/p/11815986.html

深度学习_1_神经网络_4_分布式Tensorflow

深度学习_1_神经网络_1

深度神经网络分布式训练动手学深度学习v2

分布式深度神经网络（DDNN）

【深度学习】Tensorflow——CNN 卷积神经网络 1

萤火跑模型 | 分布式训练大规模深度图神经网络

1_分布式架构的演进

深度学习_卷积神经网络（4）

1、神经网络与深度学习

深度学习（1）卷积神经网络

神经网络和深度学习1

4_分布式通信框架RMI

TensorFlow 学习（五）：深度学习、神经网络

【深度学习_2.3_1】神经网络之TensorFlow初步应用

吴恩达deep learning ai 笔记总结(1-4) 神经网络与深度学习-深层神经网络

图处理与分布式图处理，包含分布式图神经网络的综述

吴恩达深度学习笔记4-Course1-Week4【深层神经网络】

1_图神经网络GNN基础知识学习

深度学习之 TensorFlow（四）：卷积神经网络

深层神经网络--Tensorflow实战google深度学习框架

【深度学习】用tensorflow搭建自己的神经网络

深度学习之TensorFlow构建神经网络层

【深度学习】Tensorflow——CNN 卷积神经网络 2

【深度学习】循环神经网络（RNN）的tensorflow实现

【深度学习与TensorFlow 2.0】卷积神经网络（CNN）

深度学习---卷积神经网络+tensorflow实现

【深度学习】TensorFlow之卷积神经网络

神经网络-深度学习（tensorflow一般流程！）

《TensorFlow深度学习》（九）——卷积神经网络

PyTorch 深度学习实战 |用 TensorFlow 训练神经网络

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)