机器学习笔记1(什么是机器学习)

machine learning
可以想成就是在寻找一个function,要让机器具有一个能力,这种能力是根据你提供给他的资料,它去寻找出我们想要的function。

完整的框架结构可以总结如下:第一个步骤就是从一堆function中挑一个function,第二个步骤结合训练数据,让machine可以衡量你挑选的function是好还是不好,第三个步骤是让machine有一个自动的方法,有一个好的算法可以挑出最好的function。得到最好的function后,输入测试数据,就可以进行test。
在这里插入图片描述
下面简要介绍下机器学习中的相关技术,包括监督学习,半监督学习,迁移学习,无监督学习,结构化学习,强化学习。同样的颜色不同的方块是同一个类型的,蓝色指的是学习的情景,通常学习的情景是你没有办法控制的。比如,因为我们没有data做监督学习,所以我们才做reinforcement learning。红色的是指你的task,你要解的问题,你要解的这个问题随着你用的方程的不同,有regression、classification、structured。所以在不同的情境下(蓝色方块),都有可能要解这个task(红色方块)。在不同task里面有不同的model,用绿色的方块表示。
在这里插入图片描述

三大task:

回归问题
也就是machine找到的function,它的输出是一个标量(scalar),例如距离长度啥的,这个叫做regression。举例来说,在下图里,我们会要你做PM2.5的预测(比如说预测明天上午的PM2.5) ,也就是说你要找一个function,这个function的输出是未来某一个时间PM2.5的一个数值,这就是一个regression的问题。
在这里插入图片描述
分类问题
Regression和Classification的差别就是我们要机器输出的东西的类型是不一样。在Regression中机器输出的是一个数值,在Classification里面机器输出的是类别。Classification问题一般分成两种,一种叫做二分类输出为 是或否(Yes or No);另一类叫做多分类(Multi-class),在Multi-class中是让机器做一个选择题,等于是给他数个选项,每个选项都是一个类别,让他从多个类别里选择正确的类别。
在这里插入图片描述
结构化学习
structured learning 意思就是说机器的输出是要有结构性的,例如:在语音辨识里面,机器输入是声音讯号,输出是一个句子。句子是要很多词汇拼凑完成。它是一个有结构性的对象。很多教科书都直接说,machine learning是两大类的问题,regression和classification。这就好像告诉你:我们所熟知的世界只有五大洲,但是这只是真实世界的一小部分,真正的世界是如图所示。真正世界还应该包括structure learning,这里面还有很多问题是没有探究的。
在这里插入图片描述

五大情型

监督学习
第一步就是要选择function set,选不同的function set就是选不同的model。Model有很多种,最简单的就是线性模型,在非线性的模型中最耳熟能详的就是Deep learning,此外还有很多SVM等非线性模型。
监督学习需要大量的带有标签的training data。training data告诉我们要找的function的input和output之间的关系。根据这些data,选择不同的model,去完成相应的task。此外training data中的output往往没有办法用很自然的方式取得,需要人工的力量把它标注出来(标数据,纯纯牛马,大家都懂)。

半监督学习
那有没有办法减少label需要的量呢?这就是半监督学习,例如你有少量的猫和狗的labelled data,但是同时你又有大量的猫和狗的Unlabeled data,但是你没有力气去告诉机器说哪些是猫哪些是狗。你就可以使用半监督学习的技术中,把这些没有label的data也利用起来。
在这里插入图片描述
迁移学习
迁移学习的意思是:假设我们要做猫和狗的分类问题,我们只有少量有label的data。但是有大量可能有label也可能没有label的data。但是这些data跟我们现在要考虑的问题没有什么特别的关系,也就是说我们要分辨的是猫和狗的不同,但是data里面有一大堆其他动物的图片还有一堆凉宫春日,御坂美琴,你有这一大堆不相干的图片,它到底可以带来什么帮助。这个就是迁移学习要讲的问题。
在这里插入图片描述

无监督学习
就是希望机器可以学到无师自通。如果在training data 完全没有任何label的情况下,到底机器可以学到什么样的事情。举例来说,如果我们给机器看大量的文章,让机器看过大量的文章以后,它到底可以学到什么事情。

强化学习
我们若将强化学习和监督学习进行比较时,在监督学习中我们会告诉机器正确答案是什么(即label)。但在强化学习里面,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。若我们现在要用reinforcement learning方法来训练一个聊天机器人的话,他训练的方法会是这样:你就把机器发到线下,让他的和面进来的客人对话,然后想了半天以后呢,最后仍旧勃然大怒把电话挂掉了。那机器就学到一件事情就是刚才做错了。但是他不知道哪边错了,它就要回去自己想道理,是一开始就不应该打招呼吗?还是中间不应该在骂脏话了之类。它不知道,也没有人告诉它哪里做的不好,它要回去反省检讨哪一步做的不好。
在这里插入图片描述
总结:
简单来说就是介绍了机器学习是个啥,解决问题的流程是啥(train-test),要解决的问题是什么(三大task),面对这些问题,根据数据的不同特征等(有标签无标签啥的),可以分为哪些情型方式下进行讨论(五大情型),over。

引用:
B站李宏毅机器学习视频
李宏毅机器学习笔记(LeeML-Notes)

猜你喜欢

转载自blog.csdn.net/weixin_44496128/article/details/103821143
今日推荐