【吴恩达】机器学习第18章大规模机器学习 - 代码天地

【吴恩达】机器学习第18章大规模机器学习

其他 2018-11-19 05:10:51 阅读次数: 0

对于大规模数据的机器学习，有两种处理办法：一是随机梯度下降，二是减少映射（MapReduce)。

1.随机梯度下降

1.1随机梯度下降针对每个样本，更新一次参数 $\theta$ 。基本步骤是先随机打乱样本数据，然后再从头开始，一个样本一个样本训练参数。

1.2批量梯度下降：是对所有样本进行一次遍历，然后再更新一次参数 $\theta$ 。每次更新参数，都需要读入所有的数据，开销比较大。

1.3Mini-batch梯度下降：选取b个样本，进行运算，更新一次参数 $\theta$ 。每b个数据更新一次，不用遍历所有数据。并且可以的话，可以通过向量化来实现并行运算，加快速度。效果不错。但是需要确定参数b,会有时间开销。b一般在2~100之间。

2.随机梯度下降的收敛问题：

一般情况下，我们会绘制训练集上的代价函数 $J_{train}$ ，看他是不是一直下降的。在随机下降的方法里，我们会对每个 $\left ( x^{(i)},y^{(i)} \right )$ 进行计算cost函数，然后每1000g个cost函数我们进行一个平均值计算，然后绘制一个cost平均值-迭代次数的曲线，如果是下降的，则是好的。如果是反复抖动或者上升的，我们需要调整我们的学习速率 $\alpha$ （变小）或者修改特征。

一般情况下， $\alpha$ 为常数。但是我们也可以定义一个 $\alpha$ =常数1/（常数2+迭代次数）.如此一来，随着迭代次数的增加， $\alpha$ 会逐渐缩小。但是确定常数1、2需要耗费时间。

3.MapReduce

MapReduce的思想就是通过并行的办法提高效率。比如，把一个训练集分成可以并行运算的几部分，分别运算之后再整合。只要运算可以写成一系列求和的形式，就可以使用MapReduce提升效率。

3.在线学习

在线学习不存储数据集，使用过一个数据样本之后就会直接丢掉，因为他有连续的数据流。

猜你喜欢

转载自blog.csdn.net/BRAVE_NO1/article/details/82941628

【吴恩达】机器学习第18章大规模机器学习

吴恩达机器学习——第18章大规模机器学习

吴恩达机器学习—大规模机器学习

吴恩达机器学习——大规模机器学习

《吴恩达机器学习》17 大规模机器学习

吴恩达机器学习笔记 —— 18 大规模机器学习

吴恩达-coursera-机器学习测试题第十七章-大规模机器学习

第十七章大规模机器学习-机器学习老师板书-斯坦福吴恩达教授

第十七章-大规模机器学习深度之眼_吴恩达机器学习作业训练营

第十周（大规模机器学习）-【机器学习-Coursera Machine Learning-吴恩达】

吴恩达《机器学习》课程总结(17)大规模机器学习

吴恩达机器学习笔记9-大规模机器学习

吴恩达机器学习笔记（十七）——大规模机器学习

【吴恩达】机器学习第5章学习收获

【吴恩达】机器学习第19章学习收获

【吴恩达】机器学习第11章学习收获

【吴恩达】第12章机器学习学习收获

吴恩达机器学习入门笔记16/17-大规模机器学习/机器学习中的重要思想

吴恩达机器学习——第17章推荐系统

吴恩达机器学习——第19章照片OCR

吴恩达机器学习——第15章降维

吴恩达机器学习——第16章异常检测

吴恩达机器学习——第7章逻辑回归

吴恩达机器学习——第8章正则化

吴恩达机器学习（十五）大规模机器学习（Batch、Stochastic、Mini-batch gradient descent、MapReduce）

吴恩达机器学习课程笔记+代码实现(26)17.大规模机器学习(Large Scale Machine Learning)

《吴恩达机器学习》18 机器学习总结

吴恩达机器学习

机器学习——吴恩达

吴恩达机器学习

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)