深度学习基础--BP和训练--并行条件下的BP

其他 2018-11-13 09:50:55 阅读次数: 0

并行条件下的BP

原因

并行训练（parallel training）规模的情况下，在保证模型性能的同时实现训练速度线性增长在增加CPU 或 GPU 数量的同时，保证训练的线性加速以及性能。但由于工人（GPU/CPU）之间存在沟通成本和资源浪费，因此无法实现工作成果随工人数量的增多呈线性增长。

两个评价指标

训练速度和模型性能如何在增加工人（卡）数量的同时，保证工人的劳动成果（训练速度）是线性增长的，同时还要保证整个施工的质量（模型性能）。

典型算法

1）加速型SGD，最知名的方法是 ASGD（异步随机梯度下降，Asynchronous stochastic gradient descent）
通过大量 GPU 做异步计算，这是 Google 从 2012 年起就在采用的方法。但这个方法的问题在于，增加 GPU 时需要的通信代价很高，增加了系统设计优化和维护成本，同时基于同样数据的两次训练结果也会不同。

2）ASGD 加模型平均
在对大数据做并行处理时，将数据分配给每块GPU去处理，之后把计算结果取一个平均值生成新的模型，再给GPU分配数据进行处理，以此类推。这种方法很简单，但坏处在于卡数上去时模型性能会下降。

3）1-bit SGD
该方法由微软一位研究员提出，通过梯度量化和压缩技术减少通信代价，实现了 Geoffrey Hinton 30 年前提出的单机训练经典方法 mini-batch SGD 的并行化。它的主要缺点是, 在保证训练模型性能的情况下，卡数增加时无法做到训练线性加速。

猜你喜欢

转载自blog.csdn.net/wydbyxr/article/details/84023691

深度学习基础--BP和训练--并行条件下的BP

深度学习基础--BP和训练--常用的梯度下降

深度学习基础--BP和训练--梯度弥散、梯度爆炸和训练中的NAN问题

深度学习基础--BP和训练--滑动平均（moving average）和自适应步长

深度学习之BP算法

深度学习笔记（基础篇）——（三）神经网络和反向传播算法（BP）

深度学习基础：反向传播即BP算法的推导过程

深度学习基础--不同网络种类--BP网络

深度学习基础--不同网络种类--BP

【深度学习基础】简单易懂理解BP算法

深度学习 --- BP算法详解（BP算法的优化）

机器学习基础——BP算法

BP

深度学习笔记（二） BP算法

深度学习---反向传播算法BP

深度学习 — 反向传播(BP)理论推导

深度学习之BP神经网络

神经网络、BP算法、深度学习

深度学习｜BP神经网络

限制条件下计算累加和

RNN训练与BP算法

【深度学习基础】反向传播BP算法原理详解及实战演示（附源码）

深度学习 --- BP算法详解（流程图、BP主要功能、BP算法的局限性）

神经网络和深度学习（二）——BP(Backpropagation Algorithm, 反向传播算法)

【机器学习算法】神经网络和深度学习-4 重要的BP网络使用总结，了解BP神经网络的魅力

学习笔记：深度学习（2）——BP神经网络

【深度学习】BP反向传播算法Python简单实现

神经网络与深度学习（二）：BP算法

深度学习：前馈神经网络与BP反向传播

Deep Learning（深度学习)整理，RNN,CNN,BP

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)