林轩田机器学习基石3：机器学习类型划分(Types of Learning) - 代码天地

林轩田机器学习基石3：机器学习类型划分(Types of Learning)

其他 2020-01-15 13:48:21 阅读次数: 0

欢迎关注公众号-AI圈终身学习。
公众号首页回复“机器学习”查看所有系列文章。

上节主要介绍了：

二元分类(Yes/No)问题
线性可分数据的感知器演算法(PLA)
针对线性不可分数据改进的贪心算法Pocket Algorithm。

本节笔记Lecture 3包含内容如下：

机器学习类型划分(Types of Learning)
- 根据不同的输出空间Y（Learning with Different Output Space Y）
- 根据不同的数据标签 $y_n$ （Learning with Different Data Label $y_n$ ）
- 根据不同的协议(Learning with Different Protocol $f ⇒ (x_n, y_n)$ )
- 根据不同的输入（Learning with Different Input Space X）

一、根据不同的输出空间Y（Learning with Different Output Space Y）

这一节是概念性知识，很简单。不同的输出空间Y对应不一样的问题。目前我们只学了二分类问题，比如：是否批准信用卡，是否垃圾邮件，是否生病，广告是否赚钱，答案是否正确。这里的输出空间Y取值只有+1和-1两种情况。如果有：

识别数字0到9，则输出空间有10种，这叫多分类问题(Multiclass Classification)
预测病人需要多少天康复，则输出空间有无限种，这叫回归问题(Regression)

归纳一下，如果我们输出空间对应有：

两种，叫二分类问题(Binary Classification)
多种，叫多分类问题(Multiclass Classification)
无限种，叫回归问题(Regression)

二、根据不同的数据标签 $y_n$ （Learning with Different Data Label $y_n$ ）

这一节也是概念性知识，很简单。不同的数据标签 $y_n$ 对应不一样的学习方式。本节主要概念性讲：

监督学习(Supervised)
非监督学习(Unsupervised)
半监督学习(Semi-supervised)
强化学习（Reinforcement Learning）

目前我们学习的数据 $x_n与标签y_n$ 一一对应，这种叫监督学习(supervised)；

如果数据没有标签，则叫非监督学习(unsupervised)，一般的应用场景都是聚类问题；

半监督学习(semi-supervised)数据有部分标签，一般也是聚类场景，相比于非监督学习，类别种类更确定；

强化学习是一种自然的学习方式，比如训练一条狗，叫它“ $x_n=$ sit down”，如果它做了 $y_n=sit$ 就喂他饼干奖励它，否则就惩罚它。

其他的有比如广告系统、或者围棋等应用场景。通常用于学习顺序的’隐含’信息。

本节小总结如下：

三、根据不同的协议(Learning with Different Protocol $f ⇒ (x_n, y_n)$ )

根据不同的协议可以把机器学习划分成三种：

批学习(Batch Learning)
在线学习(Online Learning)
主动学习(Active Learning)

批学习(Batch Learning)是比较常见的方式，直接喂给模型一批数学，让它直接学习。

在线学习(Online Learning)是通过一条条的数据慢慢学习。如果我们要提升垃圾邮件系统性能，则他们的流程如下：

PLA和强化学习可以轻松的使用在线学习协议，因为他们都是通过一条一条的数据不断的从假设集中选择更好的假设。

而主动学习(Active Learning)是去主动问问题，即通过某种策略(strategy)选择一条自己不确定数据，询问这条数据的标签。

本节总结就是根据协议可以把机器学习分成三种：Batch、Online、Acitve。他们可以类比成：填鸭式教育、举例教育、主动问问题。目前最重要的协议是Batch Learning。

思考一下这个问题:
一个摄影师有10W张图片，标记了1000张，现在对剩下的图片分类。对于算法认为确定的图片系统直接输出它的类别，如果不确定的询问人类，这是什么协议？

四、根据不同的输入（Learning with Different Input Space X）

在机器学习领域，输入特征一般分成三种类别：

具体的特征(concrete)
原始的特征(raw)
抽象的特征(abstract)

非常容易理解。

具体的特征(concrete)有复杂的物理意义，相对而言机器学习比较容易学习这类数据，比如银行客户的信息：

原始的特征(raw)如图像的原始像素，通常需要人为的转化成具体的特征，再喂给模型，比如识别手写数字的图像输入：

抽象的特征(abstract)比如数据里面每条数据的ID，通常没有物理含义，我们需要进行特征转换/提取/构造。

本节总结：

思考一下这个问题:

假设构建一个在线图片广告系统，推送与用户最相关的图片，我们能用哪些输入特征？

五、总结

本节主要讨论了机器学习的类型划分，比较轻松简单的一节：

文中思考题答案

AI圈终身学习

发布了89 篇原创文章 · 获赞 37 · 访问量 9万+

私信关注

猜你喜欢

转载自blog.csdn.net/u012891055/article/details/85937184

林轩田机器学习基石3：机器学习类型划分(Types of Learning)

林轩田机器学习基石笔记3—Types of Learning

林轩田机器学习基石(1)：The Learning Problem

林轩田机器学习基石（Machine Learning Foundation）

台湾大学林轩田机器学习基石课程学习笔记3 -- Types of Learning

台湾大学林轩田机器学习基石课程学习笔记3--Types of Learning

（转载）林轩田机器学习基石课程学习笔记1 — The Learning Problem

林轩田机器学习基石2：学习回答Yes/No（Learning to Answer Yes/No）

林轩田-机器学习基石学习笔记2-Applications of Machine Learning?

林轩田机器学习基石课程学习笔记1 -- The Learning Problem

机器学习基石（台湾大学林轩田），Lecture 2: Learning to Answer Yes/No

林轩田机器学习基石笔记1—The Learning Problem

林轩田机器学习基石笔记4—Feasibility of Learning

林轩田机器学习基石（Machine Learning Foundations）笔记（三）

林轩田机器学习基石（Machine Learning Foundations）笔记（二）

林轩田机器学习基石（Machine Learning Foundations）笔记（四）

【台大林轩田《机器学习基石》笔记】Lecture 3——Type of Learning

台湾大学林轩田机器学习基石课程学习笔记4 -- Feasibility of Learning

台湾大学林轩田机器学习基石课程学习笔记2 -- Learning to Answer Yes/No

台湾大学林轩田机器学习基石课程学习笔记1 -- The Learning Problem

台湾大学林轩田机器学习基石课程学习笔记1--The Learning Problem

台大林轩田机器学习基石学习笔记（二）：Learning to Answer Yes/No

台大林轩田机器学习基石学习笔记（一）：The Learning Problem

台大机器学习基石 Lecture 3 - Types of Learning

机器学习基石笔记 Lecture 3 - Types of Learning

机器学习基石 Lecture3: Types of Learning

【台大林轩田《机器学习基石》笔记】Lecture 4——Feasibility of Learning

【台大林轩田《机器学习基石》笔记】Lecture 2——Learning to Answer Yes/No

【台大林轩田《机器学习基石》笔记】Lecture 1——The Learning Problem

Feasibility of Learning & Training versus Test（林轩田-机器学习）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)