吴恩达老师机器学习笔记
1、概述
本文是对吴恩达机器学习课程的总结。
2、术语介绍
2.1监督学习 VS 无监督学习
机器学习从学习方式上来看,分成两类:监督学习、无监督学习。
- 监督学习:训练集中包含了正确的答案,即我们告诉计算机正确的答案。计算机通过对特征数据及结果的学习,找到特征和正确答案的对应关系。
- 无监督学习:训练集没有标签,事先不知道其属于哪个分类,通过无监督学习分成不同的簇,所以也叫做聚类算法。
2.2回归 VS 分类
机器学习从目的上来看,有两类:回归、分类。
- 回归:计算结果是趋势,是无固定范围的,比如下个月的销售量。
- 分类:计算结果是类别,是有固定范围的,比如预测是男孩女孩,预测是好瓜、坏瓜等。
2.3代价函数
也叫误差函数,机器学习模型调优的目的就是使误差函数的值最小,对应的模型参数就是最合适的参数。
3、线性回归
包括单变量线性回顾、多变量线性回归两种,并介绍了计算代价函数的算法:梯度下降算法。
详情参考第2、5章 线性回归
4、线性代数知识
详情参考第3章 线性代数回顾
5、octave语法介绍
octave是一个免费的机器学习框架,提供了非常丰富的数据处理、可视化、运算的能力。
octave的语法请参考第6章 Octave/Matlab 教程
6、逻辑回归
逻辑回归是一个分类算法,详情参考第7章 逻辑回归
7、正则化
正则化是解决模型过拟合问题的一种解决方案,详情参考第8章 正则化
8、神经网络
神经网络是解决海量特征计算的一种有效手段,详情参考 第9章 神经网络学习,第10章 神经网络参数的反向传播算法。
9、机器学习的优化方式
介绍优化算法的常用方式及适用场景,详情见第11章 应用机器学习的建议
10、机器学习系统设计
介绍几个评估机器学习算法的工具,详情见第12章 机器学习系统设计
11、支持向量机
介绍机器学习中的常用算法,支持向量机提供比逻辑回归更好的执行效率,详情见第13章 SVM支持向量机
12、KMeans算法
KMeans是一个无监督学习算法,通过计算样本与质心的距离,而把样本分成k个簇,所以KMeans算法是一个聚类算法,详情见第14章 无监督学习
13、降维
降维就是把n维的数据转换成k维的数据,k<n,从而达到提升计算速度,节省存储空间,易于可视化的目的,详情见第15章 降维。
14、异常检测
异常检测是机器学习中一个常见算法,主要用来判断样本是否属于异常点,详情见第16章 异常检测。
15、推荐系统
详情见第17章 推荐系统
16、大规模机器学习
详情见第18章 大规模机器学习
17、照片OCR
详情见第19章 照片OCR