机器学习笔记1（什么是机器学习）

machine learning
可以想成就是在寻找一个function，要让机器具有一个能力，这种能力是根据你提供给他的资料，它去寻找出我们想要的function。

完整的框架结构可以总结如下：第一个步骤就是从一堆function中挑一个function，第二个步骤结合训练数据，让machine可以衡量你挑选的function是好还是不好，第三个步骤是让machine有一个自动的方法，有一个好的算法可以挑出最好的function。得到最好的function后，输入测试数据，就可以进行test。
在这里插入图片描述
下面简要介绍下机器学习中的相关技术，包括监督学习，半监督学习，迁移学习，无监督学习，结构化学习，强化学习。同样的颜色不同的方块是同一个类型的，蓝色指的是学习的情景，通常学习的情景是你没有办法控制的。比如，因为我们没有data做监督学习，所以我们才做reinforcement learning。红色的是指你的task，你要解的问题，你要解的这个问题随着你用的方程的不同，有regression、classification、structured。所以在不同的情境下（蓝色方块），都有可能要解这个task（红色方块）。在不同task里面有不同的model，用绿色的方块表示。
在这里插入图片描述

三大task:

回归问题
也就是machine找到的function，它的输出是一个标量（scalar），例如距离长度啥的，这个叫做regression。举例来说，在下图里，我们会要你做PM2.5的预测（比如说预测明天上午的PM2.5），也就是说你要找一个function，这个function的输出是未来某一个时间PM2.5的一个数值，这就是一个regression的问题。
在这里插入图片描述
分类问题
Regression和Classification的差别就是我们要机器输出的东西的类型是不一样。在Regression中机器输出的是一个数值，在Classification里面机器输出的是类别。Classification问题一般分成两种，一种叫做二分类输出为是或否（Yes or No）；另一类叫做多分类（Multi-class），在Multi-class中是让机器做一个选择题，等于是给他数个选项，每个选项都是一个类别，让他从多个类别里选择正确的类别。
在这里插入图片描述
结构化学习
structured learning 意思就是说机器的输出是要有结构性的，例如：在语音辨识里面，机器输入是声音讯号，输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的对象。很多教科书都直接说，machine learning是两大类的问题，regression和classification。这就好像告诉你：我们所熟知的世界只有五大洲，但是这只是真实世界的一小部分，真正的世界是如图所示。真正世界还应该包括structure learning，这里面还有很多问题是没有探究的。
在这里插入图片描述

五大情型

监督学习
第一步就是要选择function set，选不同的function set就是选不同的model。Model有很多种，最简单的就是线性模型，在非线性的模型中最耳熟能详的就是Deep learning，此外还有很多SVM等非线性模型。
监督学习需要大量的带有标签的training data。training data告诉我们要找的function的input和output之间的关系。根据这些data，选择不同的model，去完成相应的task。此外training data中的output往往没有办法用很自然的方式取得，需要人工的力量把它标注出来（标数据，纯纯牛马，大家都懂）。

半监督学习
那有没有办法减少label需要的量呢？这就是半监督学习，例如你有少量的猫和狗的labelled data，但是同时你又有大量的猫和狗的Unlabeled data，但是你没有力气去告诉机器说哪些是猫哪些是狗。你就可以使用半监督学习的技术中，把这些没有label的data也利用起来。
在这里插入图片描述
迁移学习
迁移学习的意思是：假设我们要做猫和狗的分类问题，我们只有少量有label的data。但是有大量可能有label也可能没有label的data。但是这些data跟我们现在要考虑的问题没有什么特别的关系，也就是说我们要分辨的是猫和狗的不同，但是data里面有一大堆其他动物的图片还有一堆凉宫春日，御坂美琴，你有这一大堆不相干的图片，它到底可以带来什么帮助。这个就是迁移学习要讲的问题。
在这里插入图片描述

无监督学习
就是希望机器可以学到无师自通。如果在training data 完全没有任何label的情况下，到底机器可以学到什么样的事情。举例来说，如果我们给机器看大量的文章，让机器看过大量的文章以后，它到底可以学到什么事情。

强化学习
我们若将强化学习和监督学习进行比较时，在监督学习中我们会告诉机器正确答案是什么（即label）。但在强化学习里面，我们没有告诉机器正确的答案是什么，机器所拥有的只有一个分数，就是他做的好还是不好。若我们现在要用reinforcement learning方法来训练一个聊天机器人的话，他训练的方法会是这样：你就把机器发到线下，让他的和面进来的客人对话，然后想了半天以后呢，最后仍旧勃然大怒把电话挂掉了。那机器就学到一件事情就是刚才做错了。但是他不知道哪边错了，它就要回去自己想道理，是一开始就不应该打招呼吗？还是中间不应该在骂脏话了之类。它不知道，也没有人告诉它哪里做的不好，它要回去反省检讨哪一步做的不好。
在这里插入图片描述
总结：
简单来说就是介绍了机器学习是个啥，解决问题的流程是啥（train-test），要解决的问题是什么（三大task），面对这些问题，根据数据的不同特征等（有标签无标签啥的），可以分为哪些情型方式下进行讨论（五大情型），over。

引用：
B站李宏毅机器学习视频
 李宏毅机器学习笔记(LeeML-Notes)