【台大林轩田《机器学习基石》笔记】Lecture 1——The Learning Problem

Lecture 1:The Learning Problem

1.1 What is Machine Learning

Definition

什么是“学习”?对人类来说,学习就是从观察出发,积累经验,最终掌握某种技能(比如通过听觉掌握说话,通过视觉掌握书写等)

对于机器学习,顾名思义,就是将上述的学习过程主体换成机器,如果对于技能具体定义为增进某种东西的表现,那么机器学习可以定义为:

机器学习是机器通过观察数据总结经验,最终得到某种表现的提升(解决实际问题)

举个栗子:提供给计算机股票相关的数据,计算机通过学习,最终得到更高的投资收益(收益更高的投资方法)
在这里插入图片描述

Key Essence of Machine Learning

上面介绍了机器学习的定义,那么在什么情况下适合使用机器学习解决问题?

  • Exist some ‘underlying pattern’ to be learned(问题存在潜在的模式可以学习)
  • No easy programmable definition(无法通过普通的编程定义并解决问题)
  • There is data about the pattern(存在学习所需要的数据)

1.2 Applications of Machine Learning

机器学习在衣食住行各个方面都存在广泛的应用
在这里插入图片描述

1.3 Components of Machine Learning

例子:
在这里插入图片描述

银行需要决定是否要发信用卡给客户

课程中的符号表示:
输入: x x x(申请人)

输出: y y y(是否发卡)

目标函数: f f f(想要学习的函数)

数据集(资料): D D D

假设hypothesis:机器学习不见得学到 f f f,我们希望机器学习到一个函数,我们称作假设: g g g g g g的效果在对应问题上很好(也就是说 f f f是理想的函数(或者说模式),而 g g g是能够学习到的表现最好的函数)
在这里插入图片描述

更详细的流程图:
在这里插入图片描述
在这里插入图片描述

理想的目标函数 f f f是不知道的,我们只有一些训练样本组成的训练集 D D D,这些训练样本是满足理想的目标函数 f f f的,然后通过某种算法,从假设集合 H H H中选择出机器认为最好的一个假设,也就是函数 g g g,使得 g g g f f f尽可能相似,最终要求的就是 g g g,这样就完成了整个机器学习的流程

最终的机器学习模型包括两部分:算法 A A A,假设集合 H H H

1.4 Machine Learning and Other Fields

这一部分介绍了机器学习与其他领域的关系

机器学习与数据挖掘:

机器学习:Use data to compute hypothesis g g g that approximates target f f f

数据挖掘:Use (huge) data to find property that is interesting

如果数据挖掘当中有用的属性就是机器学习所需要的假设(函数 f f f),那么二者是相同的

如果二者是相关的但并非完全相同,那么机器学习和数据挖掘可以互相支持

实际上完全区分二者是非常困难的

机器学习与人工智能

人工智能:Compute something that shows intelligent behavior

我们可以看成机器学习是实现人工智能的一种方法

机器学习与统计

统计:Use data to make inference about an unknown process

可以把 g g g看作推论的结果, f f f看作是未知,从这个角度,统计是用于实现机器学习的一种方法

传统统计学更关注于数学假设下获得的可证明推论

1.5 Summary

这节课主要介绍了机器学习的概念,以及机器学习的使用条件与具体应用

然后也介绍了机器学习的流程,与其他类似领域进行了比较

猜你喜欢

转载自blog.csdn.net/i0o0iW/article/details/112287416
今日推荐