机器学习笔记——大规模机器学习（large scale machine learning）

其他 2019-02-24 10:30:59 阅读次数: 0

大规模机器学习

大规模机器学习指的是训练样本数量非常大的情况。

随机梯度下降

我们在用梯度下降求解代价函数的最小值时我们每一次迭代都要让所有数据都参与一次运算，因此我们也将其叫做批梯度下降（batch gradient desent），这样带来的运算量将会非常大

为了解决这个问题，我们可以采用随机梯度下降（stochastic）算法，每次θ更新只将一个数据纳入样本计算，这样相当于每次更新迭代只针对某一个数据进行优化，但是对于整体代价函数不见得每次都朝最小值处衍进，而是一个曲折下降的过程，但是最终可以收敛到最小值附近

另外还有处在批梯度下降和随机梯度下降之间的方法叫做迷你批梯度下降（mini-batch gradient descent），它每次采用b个数据来更新θ，这样使得算法收敛可以更加迅速

收敛性

我们可以通过以下的方式检查随机梯度下降算法的收敛性，例如我们每一千个循环计算上一千个数据的代价函数

可以有以下结果，下图三的情况很可能是取点间隔太近了，如果我们每隔5000个数据计算一次代价函数，可能就很很好看到代价函数下降的过程了。而如果代价函数一直是上升的，代表我们的学习速率太大了

为了让算法收敛速度更快，我们还可以根据算法迭代的次数来自动调整学习速率

在线学习

当我们有源源不断的数据时我们可以让算法在线学习新数据的特征，我们每来一个新的数据后用随机梯度下降算法来减小代价函数，之后把这个数据抛弃，等待下一个数据的到来。这样的好处是能够让算法随时学习数据特征的改变

以下是另外一个例子

Map-reduce

除了随机梯度下降算法，我们还可以采用map-reduce技术来加快算法的收敛，map-reduce说到底就是并行计算，把本来一次需要计算的数据（例如400个）分配到四台机器上，这样理论上算法就能加快四倍

另外一些高级优化也能通过map-reduce加速

除了将计算放到多台机器上，我们还可以放到多个CPU核心上来实现并行计算

猜你喜欢

转载自blog.csdn.net/shanwenkang/article/details/85547541

大规模机器学习（Large Scale Machine Learning）

Large scale machine learning(大规模机器学习)

机器学习笔记8——大规模机器学习(Large scale machine learning)

机器学习笔记——大规模机器学习（large scale machine learning）

【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 17—Large Scale Machine Learning 大规模机器学习

吴恩达机器学习课程笔记+代码实现(26)17.大规模机器学习(Large Scale Machine Learning)

如何进行大规模机器学习(Large Scale Machine Learning)

学习笔记-Large scale machine learning

吴恩达机器学习之大规模机器学习(Large Scale Machine Learning)：大型数据集的学习、随机梯度下降法、小批量梯度下降、映射化简和数据并行（详细笔记，建议收藏，已有专栏）

吴恩达机器学习笔记（十一） —— Large Scale Machine Learning

Coursera-吴恩达-机器学习-第十周-测验-Large Scale Machine Learning

Machine Learning第十讲【大规模机器学习】

Dynamic Control Flow in Large-Scale Machine Learning

Toward Large-Scale Vulnerability Discovery using Machine Learning

Week 10:Large Scale Machine Learning课后习题解答

TensorFlow: A System for Large-Scale Machine Learning翻译

Machine Learning（机器学习）

机器学习(Machine Learning)

机器学习（Machine Learning）

机器学习：增量学习论文解读—— large scale incremental learning

学习笔记之机器学习（Machine Learning）

导航-机器学习(Machine Learning)

machine learning(kaggle)机器学习。

IoT Machine Learning机器学习

机器学习（Machine Learning：ML）

Machine Learning:机器学习算法

Machine Learning机器学习入门

【Machine Learning】初识机器学习

【Machine Learning】初识机器学习

[翻译] TensorFlow 分布式之论文篇 Large-Scale Machine Learning on Heterogeneous Distribute

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)