林轩田机器学习基石课程个人笔记-第三讲

这一讲主要学习了有关机器学习类型的相关内容。在前面的学习中提到一个有关信用卡发放的例子，我们根据一些相关的数据来绝对是否对某一用户发放信用卡，那么得到的结果就是NO（-1）和YES（+1）。
在这里插入图片描述

这就是机器学习最基础的一种问题：二分类问题。即根据输入的数据进行判断，最后给出两个类型的结果，非此即彼。
在这里插入图片描述
二分类问题在我们的生活中是很普遍的存在，像提到的信用卡的发放问题，以及垃圾邮件的过滤、判断一个人是否生病、对于某一问题的答案是否正确等等。分类的模型有的是线性的，有的是非线性的，我们需要根据我们具体的应用场景进行合适的选择。
在这里插入图片描述

除了基本的二分类问题外，自然有多分类问题，如手写数字的识别、图像的多分类、邮件的归类等等。不过多分类问题也可以转换为二分类问题，所以二分类问题是学习的基础。
在这里插入图片描述
在前面的分类问题中，我们的输出都是离散的，此外还有一种情况就是我们的输出是连续的，这类问题叫做回归问题（Regression），它的输出范围是整个实数空间，连续的。例如模型的训练、房屋价格的预测、股市走向的预测……最基本的回归模型是线性回归，此外我们还将学到其他的很多种的回归模型。
在这里插入图片描述
除了分类和回归问题，在自然语言处理等领域中，还会用到一种机器学习问题：结构化学习（Structured Learning）。结构化学习的输出空间包含了某种结构在里面，它的一些解法通常是从多分类问题延伸而来的，比较复杂。
在这里插入图片描述
总结一下上面学到的东西，主要是机器学习的相关分类，包括二分类问题、多分类问题、回归、结构化学习等。

如果我们拿到的训练样本D既有输入特征x，也有输出yn，那么我们把这种类型的学习称为监督式学习（Supervised Learning）。监督式学习可以是二元分类、多元分类或者是回归，最重要的是知道输出标签yn。
在这里插入图片描述

与监督式学习相对立的另一种类型是非监督式学习（Unsupervised learning）。非监督式学习是没有输出标签yn的，典型的非监督式学习包括：聚类（clustering）问题，比如对网页上新闻的自动分类；密度估计，比如交通路况分析；异常检测，比如用户网络流量监测。通常情况下，非监督式学习更复杂一些，而且非监督的问题很多都可以使用监督式学习的一些算法思想来实现。
在这里插入图片描述

介于监督式和非监督式学习之间的叫做半监督式学习（Semisupervised Learning）。半监督式学习是说一部分数据有输出标签yn，而另一部分数据没有输出标签yn。在实际应用中，半监督式学习有时候是必须的，比如医药公司
对某些药物进行检测，考虑到成本和实验人群限制等问题，只有一部分数据有输出标签yn。
在这里插入图片描述

此外还有一种很不同但是很贴近实际的学习模型：强化学习（Reinforcement Learning），之前很火的AlphaGO就是强化学习的应用实例，有兴趣的可以看看那两篇论文。强化学习中，我们给模型或系统一些输入，但是给不了我们希望的真实的输出y，根据模型的输出反馈，如果反馈结果良好，更接近真实输出，就给其正向激励，如果反馈结果不好，偏离真实输出，就给其反向激励。不断通过“反馈修正”这种形式，一步一步让模型学习的更好，这就是强化学习的核心所在。
在这里插入图片描述

强化学习可以类比成训练宠物的过程，比如我们要训练狗狗坐下，但是狗狗无法直接听懂我们的指令“sit down”。在训练过程中，我们给狗狗示意，如果它表现得好，我们就给他奖励，如果它做跟sit down完全无关的动作，我们就给它小小的惩罚。这样不断修正狗狗的动作，最终能让它按照我们的指令来行动。实际生活中，强化学习的例子也很多，比如根据用户点击、选择而不断改进的广告系统。有关强化学习的方向内容很多，值得我们在后面的学习中专门进行学习。
在这里插入图片描述

因此我们可以根据不同的数据标签将学习分为有监督的学习、无监督的学习、半监督的学习、强化学习等等。
在这里插入图片描述

按照不同的协议，机器学习可以分为三种类型：
• Batch Learning
• Online
• Active Learning
batch learning是一种常见的类型。batch learning获得的训练数据D是一批的，即一次性拿到整个D，对其进行学习建模，得到我们最终的机器学习模型。batch learning在实际应用中最为广泛。例如我们在对硬币进行分类时，我们一次拿到的一堆的硬币，对其进行分类就是批学习的一个实例。
在这里插入图片描述
online是一种在线学习模型，数据是实时更新的，根据数据一个个进来，同步更新我们的算法。比如在线邮件过滤系统，根据一封一封邮件的内容，根据当前算法判断是否为垃圾邮件，再根据用户反馈，及时更新当前算法。这是一个动态的过程。
在这里插入图片描述
在线学习就是通过不断获得的数据持续的提升所做的假设的合理性。

active learning是近些年来新出现的一种机器学习类型，即让机器具备主动问问题的能力，这种学习方法很像上课，例如手写数字识别，机器自己生成一个数字或者对它不确定的手写字主动提问。它的优势之一是在获取样本label比较困难的时候，可以节约时间和成本，只对一些重要的label提出需求。
在这里插入图片描述

总结一下，按照不同的协议，机器学习可以分为batch, online, active。
在这里插入图片描述

下面我们来看一下输入X有哪些类型。

concrete features：比如说硬币分类问题中硬币的尺寸、重量等；疾病诊断中的病人信息等具体特征。concrete features对机器学习来说最容易理解和使用。
raw features：比如说手写数字识别中每个数字所在图片的mxn维像素值；比如语音信号的频谱等。raw features一般比较抽象，经常需要人或者机器来转换为其对应的concrete features，这个转换的过程就是Feature Transform。
abstract features：比如某购物网站做购买预测时，提供给参赛者的是抽象加密过的资料编号或者ID，这些特征X完全是抽象的，没有实际的物理含义。所以对于机器学习来说是比较困难的，需要对特征进行更多的转换和提取。

总结一下，根据输入X类型不同，可以分为concetet, raw, abstract。将一些抽象的特征转换为具体的特征，是机器学习过程中非常重要的一个环节。

最后总结一下，这一讲我们主要是通过不同的方式对机器学习进行了一个分类，对于整个研究的领域有一个初步的认识。
在这里插入图片描述

林轩田机器学习基石课程个人笔记-第三讲

猜你喜欢