1、概述

本文是对吴恩达机器学习课程的总结。

吴恩达机器学习课程

2、术语介绍

2.1监督学习 VS 无监督学习

机器学习从学习方式上来看，分成两类：监督学习、无监督学习。

监督学习：训练集中包含了正确的答案，即我们告诉计算机正确的答案。计算机通过对特征数据及结果的学习，找到特征和正确答案的对应关系。
无监督学习：训练集没有标签，事先不知道其属于哪个分类，通过无监督学习分成不同的簇，所以也叫做聚类算法。

2.2回归 VS 分类

机器学习从目的上来看，有两类：回归、分类。

回归：计算结果是趋势，是无固定范围的，比如下个月的销售量。
分类：计算结果是类别，是有固定范围的，比如预测是男孩女孩，预测是好瓜、坏瓜等。

2.3代价函数

也叫误差函数，机器学习模型调优的目的就是使误差函数的值最小，对应的模型参数就是最合适的参数。

3、线性回归

包括单变量线性回顾、多变量线性回归两种，并介绍了计算代价函数的算法：梯度下降算法。
详情参考第2、5章线性回归

4、线性代数知识

详情参考第3章线性代数回顾

5、octave语法介绍

octave是一个免费的机器学习框架，提供了非常丰富的数据处理、可视化、运算的能力。
octave的语法请参考第6章 Octave/Matlab 教程

6、逻辑回归

逻辑回归是一个分类算法，详情参考第7章逻辑回归

7、正则化

正则化是解决模型过拟合问题的一种解决方案，详情参考第8章正则化

8、神经网络

神经网络是解决海量特征计算的一种有效手段，详情参考第9章神经网络学习，第10章神经网络参数的反向传播算法。

9、机器学习的优化方式

介绍优化算法的常用方式及适用场景，详情见第11章应用机器学习的建议

10、机器学习系统设计

介绍几个评估机器学习算法的工具，详情见第12章机器学习系统设计

11、支持向量机

介绍机器学习中的常用算法，支持向量机提供比逻辑回归更好的执行效率，详情见第13章 SVM支持向量机

12、KMeans算法

KMeans是一个无监督学习算法，通过计算样本与质心的距离，而把样本分成k个簇，所以KMeans算法是一个聚类算法，详情见第14章无监督学习

13、降维

降维就是把n维的数据转换成k维的数据，k<n，从而达到提升计算速度，节省存储空间，易于可视化的目的，详情见第15章降维。

14、异常检测

异常检测是机器学习中一个常见算法，主要用来判断样本是否属于异常点，详情见第16章异常检测。

15、推荐系统

详情见第17章推荐系统

16、大规模机器学习

详情见第18章大规模机器学习

17、照片OCR

详情见第19章照片OCR

丨知耻而后勇丨

发布了48 篇原创文章 · 获赞 34 · 访问量 19万+

私信关注

吴恩达老师机器学习笔记