吴恩达机器学习笔记9-大规模机器学习 - 代码天地

吴恩达机器学习笔记9-大规模机器学习

其他 2018-08-12 06:56:12 阅读次数: 0

最强的机器学习方法：使用低偏差的算法和大量的数据

使用大量数据前先检查一下使用少量的数据行不行，也要通过训练集和验证集的cost图来判断是否需要继续增加数据

随机梯度下降

很多学习算法使用了梯度下降的算法。当m很大时，计算梯度就会变得很复杂，这种算法叫做批量梯度下降，每次考虑所有的样本。假如有3亿的数据，每次求梯度都会很慢。
而随机梯度下降每次只考虑一个训练样本
1. 将所有数据打乱，将m个样本重新排列
2. 遍历每个样本，对所有参数进行梯度下降
实际上就是每次只学习一个样本

Mini-batch梯度下降

每次学一个batch,batch size一般在[10,100]范围内
Mini batch比随机梯度更快
额外的缺点是参数batch size，需要花时间来确定

SGD是否收敛

在训练第i个样本之前测试一下它的cost，最后把所有的cost画出来，观察是否在下降

在线学习

连续的数据流输入的时候

repeat forever
{
  Get (x,y) from user
  update parameters using (x,y)
}

它可以对用户的改变进行自动适配

Map Reduce

将数据划分为几个子集，分给每个计算机
假如有400个样本，在计算线性回归的梯度时每台计算机只计算梯度公式中求和的一部分，最后把4个部分和加起来求梯度

如果想要应用到其它算法上，应该看是否可以表示为训练样本的一个求和。

在同一台电脑的不同CPU上也可以实现并行

猜你喜欢

转载自blog.csdn.net/zic234gh9/article/details/81590405

吴恩达机器学习笔记9-大规模机器学习

《吴恩达机器学习》17 大规模机器学习

吴恩达机器学习——大规模机器学习

吴恩达机器学习—大规模机器学习

吴恩达机器学习笔记 —— 18 大规模机器学习

吴恩达机器学习笔记（十七）——大规模机器学习

吴恩达机器学习入门笔记16/17-大规模机器学习/机器学习中的重要思想

吴恩达机器学习入门笔记9-支持向量机

吴恩达机器学习课程笔记+代码实现(26)17.大规模机器学习(Large Scale Machine Learning)

吴恩达《机器学习》课程总结(17)大规模机器学习

【吴恩达】机器学习第18章大规模机器学习

吴恩达机器学习——第18章大规模机器学习

吴恩达机器学习总结（9）

吴恩达机器学习笔记week9

吴恩达-coursera-机器学习测试题第十七章-大规模机器学习

吴恩达机器学习（十五）大规模机器学习（Batch、Stochastic、Mini-batch gradient descent、MapReduce）

第十周（大规模机器学习）-【机器学习-Coursera Machine Learning-吴恩达】

第十七章大规模机器学习-机器学习老师板书-斯坦福吴恩达教授

斯坦福大学吴恩达机器学习教程中文笔记——week10——大规模机器学习，应用实例：图片文字识别，总结

吴恩达机器学习笔记（一）

吴恩达机器学习笔记（六）

吴恩达机器学习笔记（十二）

吴恩达机器学习笔记（八）

吴恩达机器学习笔记（十一）

吴恩达机器学习笔记（十）

吴恩达机器学习笔记（七）

吴恩达机器学习笔记（四）

吴恩达机器学习笔记（三）

吴恩达机器学习笔记（二）

吴恩达机器学习笔记（五）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)