文章目录
Lecture 1:The Learning Problem
1.1 What is Machine Learning
Definition
什么是“学习”?对人类来说,学习就是从观察出发,积累经验,最终掌握某种技能(比如通过听觉掌握说话,通过视觉掌握书写等)
对于机器学习,顾名思义,就是将上述的学习过程主体换成机器,如果对于技能具体定义为增进某种东西的表现,那么机器学习可以定义为:
机器学习是机器通过观察数据总结经验,最终得到某种表现的提升(解决实际问题)
举个栗子:提供给计算机股票相关的数据,计算机通过学习,最终得到更高的投资收益(收益更高的投资方法)
Key Essence of Machine Learning
上面介绍了机器学习的定义,那么在什么情况下适合使用机器学习解决问题?
- Exist some ‘underlying pattern’ to be learned(问题存在潜在的模式可以学习)
- No easy programmable definition(无法通过普通的编程定义并解决问题)
- There is data about the pattern(存在学习所需要的数据)
1.2 Applications of Machine Learning
机器学习在衣食住行各个方面都存在广泛的应用
1.3 Components of Machine Learning
例子:
银行需要决定是否要发信用卡给客户
课程中的符号表示:
输入: x x x(申请人)
输出: y y y(是否发卡)
目标函数: f f f(想要学习的函数)
数据集(资料): D D D
假设hypothesis:机器学习不见得学到 f f f,我们希望机器学习到一个函数,我们称作假设: g g g, g g g的效果在对应问题上很好(也就是说 f f f是理想的函数(或者说模式),而 g g g是能够学习到的表现最好的函数)
更详细的流程图:
理想的目标函数 f f f是不知道的,我们只有一些训练样本组成的训练集 D D D,这些训练样本是满足理想的目标函数 f f f的,然后通过某种算法,从假设集合 H H H中选择出机器认为最好的一个假设,也就是函数 g g g,使得 g g g与 f f f尽可能相似,最终要求的就是 g g g,这样就完成了整个机器学习的流程
最终的机器学习模型包括两部分:算法 A A A,假设集合 H H H
1.4 Machine Learning and Other Fields
这一部分介绍了机器学习与其他领域的关系
机器学习与数据挖掘:
机器学习:Use data to compute hypothesis g g g that approximates target f f f
数据挖掘:Use (huge) data to find property that is interesting
如果数据挖掘当中有用的属性就是机器学习所需要的假设(函数 f f f),那么二者是相同的
如果二者是相关的但并非完全相同,那么机器学习和数据挖掘可以互相支持
实际上完全区分二者是非常困难的
机器学习与人工智能
人工智能:Compute something that shows intelligent behavior
我们可以看成机器学习是实现人工智能的一种方法
机器学习与统计
统计:Use data to make inference about an unknown process
可以把 g g g看作推论的结果, f f f看作是未知,从这个角度,统计是用于实现机器学习的一种方法
传统统计学更关注于数学假设下获得的可证明推论
1.5 Summary
这节课主要介绍了机器学习的概念,以及机器学习的使用条件与具体应用
然后也介绍了机器学习的流程,与其他类似领域进行了比较