ML/DL入门介绍(底层理解+基本概念)

Datawhale202211—李宏毅《机器学习》(深度学习方向)

ML的基本情况+相关技术+学习目标
(这里结合了李沐大神的《动手学深度学习的部分内容》)



前言

随着人工智能的不断发展,机器学习这门技术也越来越重要,本文就介绍了机器学习的基础内容。该笔记结合了《机器学习》和《动手学深度学习》两门课(前者为主),更好地认识ML和DL。


一、Machine Learning基本介绍

机器学习本质:从数据中确定一个函数。

简述发展

在这里插入图片描述
从AI技术席卷全球以来,我们很多技术都只是在理论层面推进,真正成为大众心中的产品变成人人可用或受益的技术还是任重道远的。纵然AI也被调侃或怀疑,但是我们从业者应当更理智地看待我们的工作,看到它的价值和未来。
在这里插入图片描述
机器学习其实只有三个步骤,这三个步骤简化了整个process。可以类比为:把大象放进冰箱。我们把大象塞进冰箱,其实也是三个步骤:把门打开;象塞进去;后把门关起来,然后就结束了。所以说,机器学习三个步骤,就好像是说把大象放进冰箱,也只需要三个步骤。

二、相关技术

在这里插入图片描述

监督学习

在这里插入图片描述
定义:根据已有的数据集,知道输入和输出结果之间的关系。根据这种已知的关系,训练得到一个最优的模型。也就是说,在监督学习中训练数据既有特征(feature)又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签

应用举例:回归、分类
PM2.5的预测 房价预测

无监督学习

定义:我们不知道数据集中数据、特征之间的关系,而是要根据聚类或一定的模型得到数据之间的关系。可以这么说,比起监督学习,无监督学习更像是自学,让机器学会自己做事情,是没有标签(label)的。

应用举例:新闻分类

迁移学习

迁移学习(Transfer Learning)是把一个领域(源领域)的知识,迁移到另外一个领域(目标领域),使得目标领域能够取得更好的学习效果。通常,源领域数据量充足,而目标领域数据量较小,这种场景就很适合做迁移学习。

应用举例:情感分类

监督学习中的结构化学习

Structured Learning不是一种具体的技术,只是一种描述问题,分析问题的方法。

应用举例:摘要生成

强化学习

强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是 机器学习 的 范式 和 方法论 之一,用于描述和解决 智能体 (agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。

应用举例:围棋、星际争霸

三、为什么要学习机器学习

很多人说AI可能代替人类,当然这是很多学科的重要课题,我们这里不予讨论。但是随着AI技术的发展也会诞生很多新的职业类型,甚至是新的行业,下面我们介绍几类AI的相关职业。

模型训练师

课程里有一个有趣形象的比喻,把模型训练师比作宝可梦训练师,需要关注模型的选择和优化,为应用场景选择loss function和model。因此一个好用的模型离不开一个有经验有创新思维的训练师。其实目前并没有清晰的该岗位的分化,因为所有从业者都必须通过训练模型来夯实基本功,才能更好地进阶,当然期待未来有类似岗位的诞生,拯救一下就业寒冬中的同学们。

领域专家

这个职业会更偏重行业的经验和洞察,可能在某行业内深耕多年的行业专家并且有ML的知识背景会非常适合这个岗位。通过经验和洞察发现某行业中AI的具体应用场景,并且ML/DL的方法恰好可以很好的解决相关问题,是能够帮助AI模型很好落地的强大力量,未来会是AL前沿理论和AI社会价值的桥梁。

数据科学家

这个职业更倾向于实验和科研,可能有丰富的实验经验和知识基础以及实践能力的科班从业者更能发挥强大的能量。他们往往需要从领域专家处拿到数据,依据数据搭建模型来解决对应得问题,非要和传统IT岗位比较得话,该职业会比较近似于工程师,领域专家更近似于产品经理。

AI专家

这个职业更加学术化,可能长期从事科研工作的科学家会更加得心应手。主要是关注模型的精度提升和优化,更好地推动理论上的发展。

当然,这样的划分是不严谨的,并且目前的从业者往往身兼数职,另一方面想更好地从事AI相关工作以上职业的能力都需要具备。但我们会看到未来的一些值得期待的风景,也是我们不断学习进步的动力。

四、参考文档

来自Datawhale的投喂

李宏毅《机器学习》开源内容1:
https://linklearner.com/datawhale-homepage/#/learn/detail/93
李宏毅《机器学习》开源内容2:
https://github.com/datawhalechina/leeml-notes
李宏毅《机器学习》开源内容3:
https://gitee.com/datawhalechina/leeml-notes

来自官方的投喂

李宏毅《机器学习》官方地址
http://speech.ee.ntu.edu.tw/~tlkagk/courses.html
李沐《动手学深度学习》官方地址
https://zh-v2.d2l.ai/

来自广大网友的投喂

知智小动画理解相关概念
https://www.bilibili.com/video/BV1DW411v7TF/?spm_id_from=333.337.search-card.all.click


总结

本节内容是了解性的,对后续的学习起到引领的作用,对一些基本的概念有一定的认识。李宏毅老师的课程非常有趣清晰,仅仅从本节内容中就可以了解到老师对AI的一些态度和看法,后面继续前进希望收获更多惊喜。

猜你喜欢

转载自blog.csdn.net/weixin_50967907/article/details/127845988