小白都理解的人工智能系列(1)——理解机器学习

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/taczeng/article/details/79150903

机器学习

搞懂以下三个问题,你就算了解了机器学习的概念!


问题1:机器学习的发展已经很多年了,它是人工智能的入门级技术,那么什么是机器学习呢?

顾名思义:机器通过学习,不断调整和优化自己认知世界的方式;它是一帮计算机科学家希望计算机像人一样思考所研发出来的理论,既然要学习,肯定得需要大量学习资料(数据)。它是一门跨学科的技术,涉及到的知识有python编程(主流),大数据(hadoop即可),概率论,统计学等学科;


问题2:机器学习有哪些实际运用呢?

比如文本处理:广告计算,机器翻译等;机器视觉:无人车,百度图片搜索,人脸识别等;语音识别:地图导航,只能家居等;

应用很广,接下来会有更多应用越来越多并且越大众化。


问题3:机器学习有哪些分类?

一般来说分为4-5类

我们把数据和程序都取个别名,理解接下来的概念有助于你了解下面的知识。

数据:1000万张猫,1000万张狗图片

有标签的图片:一只猫的图片,对应告诉Alpha蚂蚁这是一只猫

没有标签的图片:一只猫的图片,对应告诉Alpha蚂蚁这是一个图片,但是不知道是猫还是狗

程序:Alpha蚂蚁

监督学习:提供数据和对应的标签值

比如让Alpha蚂蚁识别猫和狗的图片,先要给大量的猫和狗的图片(比如1000万张猫,1000万张狗)给Alpha蚂蚁识别,并且告诉它,哪一张图是猫,哪一张图是狗;让Alpha蚂蚁去学习这2000万张图片的70%左右,剩下的30%图片作为测试,测试这个训练出的结果正确率如何(类似于人类世界的考试,根据考试结果判定你学习得怎么样),如果测试结果达到90%多,那么算是不错的,目前人脸识别能达到99%多;接下来的事情就容易了,下次你再来一张猫或狗的图片,Alpha蚂蚁就自然能够认识你的图片是猫还是狗了。


无监督学习:不提供相应的标签(观察各种数据背后的规律)

大部分情况下,数据是有很多,但是呢,相应的标签是比较乱的,甚至很多都是错误的;类似于试卷很多,但是呢,答案很多都是错误的,这种情况下,机器学习就学到了错误的答案,这可是不允许的;所以,在这种情况下,就要使用无监督学习了,无监督学习就是只有数据,不再有对应的标签,还是举猫狗案例,1000万张猫,1000万张狗,Alpha蚂蚁这个时候去观察这些猫猫狗狗的信息,找出它们相应共有的特征,这样,将这些猫狗图片就能进行分类识别了。


半监督学习:结合监督学习和无监督学习,如何利用少量有标签的样本和大量没有标签的样本进行分类

突然一个时候,告诉你只有3张猫的图片,和三张狗的图片,剩下的猫狗图片有很多,但是没做分类,不知道是猫还是狗,Alpha蚂蚁没办法了,这么少的图片,肯定没法去训练,那该怎么办,先就用半监督学习,利用这6张图进行监督学习的分类训练,再利用剩下的没有标签的图片进行无监督训练,最终达到给一张图片就能识别是猫还是狗的分类。


强化学习:让计算机完成一个从未接触过的任务,提供相应的规则,让计算机自己去总结和学习

现在为止,Alpha蚂蚁已经十分强大了,能干很多事,但是,现在要把Alpha蚂蚁训练成为一个投篮高手,但是投篮是一个很多样化的操作,不太好提供数据训练,那么怎么办?就让Alpha蚂蚁自己去投篮,不管你用什么方式,投篮进去了奖励你吃一个苹果(这可是Alpha蚂蚁最喜欢的水果),进不去就扇Alpha蚂蚁一嘴巴子(被虐待的好惨);Alpha蚂蚁就自己在那里练习投篮,通过不断的练习,Alpha蚂蚁最终掌握了最好的投篮方式,命中率也越来越高,最终成为了投篮高手!没错,AlphaGo就是这么玩的。


遗传算法:模拟进化理论,淘汰弱智,保留强者

Alpha蚂蚁要是一直练不会投篮怎么办呢?它就是一个不合格的投篮者,永远练不会怎么办。那就这样,淘汰这货,再生出1个更优的Alpha蚂蚁一代,依次进行淘汰,淘汰弱智,保留强者,这样就训练出了一个终极的Alpha蚂蚁N代,这是一个非常非常牛逼的新生代,是Alpha蚂蚁重重重重重重重重重重重重重重重重孙子。


至此,我们就把机器学习的基本内容讲完了,并未涉及任何算法,希望能让大家对机器学习感兴趣,研究相应的实现!

猜你喜欢

转载自blog.csdn.net/taczeng/article/details/79150903