吴恩达机器学习笔记（一）——监督学习与无监督学习

文章目录

前言
一、应用领域
二、定义
三、分类

前言

最近在网易云课堂上学习吴恩达老师的机器学习课程。吴老师的课讲的通俗易懂、深入浅出，令我获益良多，在这里记录一下学习过程的一些知识点和个人理解，欢迎各位童鞋一起交流。这一节主要介绍第一章绪论中的内容。

一、应用领域

机器学习是人工智能的一个重要分支，目前主要的应用方向包括以下四类：
1、数据挖掘
互联网和自动化发展过程中产生了大量数据，例如网络浏览数据、医疗数据等，机器学习提供了一个很好的分析和使用这些数据的途径。
2、输入变量太多而无法手动编写代码的应用
在自动驾驶、手写字体识别、自然语言识别、计算机视觉等领域，涉及到的变量千变万化，人们很难编写出一个确切的算法程序来应对各种情况的输入。而机器学习算法可以自动分析大量的输入数据并找出最优的结果。
3、私人订制化的程序代码
我们在淘宝或亚马逊上购物时，网站会根据每个人的喜好来推荐相应的产品，网站不可能专门为每个人写一个产品推荐的代码，而通过机器学习可以达到这个目的。
4、理解、模拟人类的学习方法，实现真正的AI。

二、定义

关于机器学习目前还没有一个统一的定义，按照1959年Arthur Samuel的定义：Machine Learning is the field of study that gives computers the ability to learn without being explicitly programmed. 即机器学习研究的是如何在不需具体编程的情况下赋予电脑自己学习的能力。

1988年Tom Mitchell给出了更具体的一个定义：A computer is said to learn from experience E with respect to some tarsk T and some performance P, if its performance on T,as measured by P, improves with experience E. 即如果一台电脑在执行某项任务T中的的表现P能够随着经验E的增加而提高，我们就说它是从经验E中学习。

三、分类

目前最常用的两种算法就是监督学习（supervised learning）和无监督学习（unsupervised learning）。

监督学习
所谓监督学习就是在有成功经验可循的情况下的学习。我们有大量的输入数据（或者称之为特征，x），并且知道每一组输入特征x对应输出的“正确答案”y。我们的算法负责找出y与x之间最优的函数映射关系y=f(x)，这样，当我们有一组数据库中没有的新的输入特征x’时，我们就可以利用算法找到的函数f来估计对应的输出了：y’=f(x’)。
这里，如果y是价格、气压、温度等可连续变化的值，我们称其为回归（regression）问题，监督学习过程实际上就是我们在做实验时经常用到的拟合的过程。而如果y只能取一系列离散的值，我们称其为分类（classification）问题，监督学习的过程就是要判断每一组特征对应的是哪一种结果，例如判断一封邮件是否垃圾邮件、判断一个手写的数字是几、判断一张动物照片是什么动物等。

无监督学习
所谓无监督学习则是在没有成功经验情况下的学习，即我们只有一堆的输入特征x，而没有所谓的“正确答案”y。这种情况下，学习算法通常负责找出这些特征x之间的关联，如聚类算法，其作用是根据各个x的特点，将其划分成若干个小的团体，这样，人们就可以针对不同的团体采取不同的措施，例如推荐商品、组建社交网络等。

吴老师课程的主体部分还是在监督学习算法的介绍上。下一章就从最简单的监督学习算法——线性回归开始学习了。