小白都理解的人工智能系列（1）——理解机器学习

机器学习

搞懂以下三个问题，你就算了解了机器学习的概念！

问题1：机器学习的发展已经很多年了，它是人工智能的入门级技术，那么什么是机器学习呢？

顾名思义：机器通过学习，不断调整和优化自己认知世界的方式；它是一帮计算机科学家希望计算机像人一样思考所研发出来的理论，既然要学习，肯定得需要大量学习资料（数据）。它是一门跨学科的技术，涉及到的知识有python编程（主流），大数据（hadoop即可），概率论，统计学等学科；

问题2：机器学习有哪些实际运用呢？

比如文本处理：广告计算，机器翻译等；机器视觉：无人车，百度图片搜索，人脸识别等；语音识别：地图导航，只能家居等；

应用很广，接下来会有更多应用越来越多并且越大众化。

问题3：机器学习有哪些分类？

一般来说分为4-5类

我们把数据和程序都取个别名，理解接下来的概念有助于你了解下面的知识。

数据：1000万张猫，1000万张狗图片

有标签的图片：一只猫的图片，对应告诉Alpha蚂蚁这是一只猫

没有标签的图片：一只猫的图片，对应告诉Alpha蚂蚁这是一个图片，但是不知道是猫还是狗

程序：Alpha蚂蚁

监督学习：提供数据和对应的标签值

比如让Alpha蚂蚁识别猫和狗的图片，先要给大量的猫和狗的图片（比如1000万张猫，1000万张狗）给Alpha蚂蚁识别，并且告诉它，哪一张图是猫，哪一张图是狗；让Alpha蚂蚁去学习这2000万张图片的70%左右，剩下的30%图片作为测试，测试这个训练出的结果正确率如何（类似于人类世界的考试，根据考试结果判定你学习得怎么样），如果测试结果达到90%多，那么算是不错的，目前人脸识别能达到99%多；接下来的事情就容易了，下次你再来一张猫或狗的图片，Alpha蚂蚁就自然能够认识你的图片是猫还是狗了。

无监督学习：不提供相应的标签（观察各种数据背后的规律）

大部分情况下，数据是有很多，但是呢，相应的标签是比较乱的，甚至很多都是错误的；类似于试卷很多，但是呢，答案很多都是错误的，这种情况下，机器学习就学到了错误的答案，这可是不允许的；所以，在这种情况下，就要使用无监督学习了，无监督学习就是只有数据，不再有对应的标签，还是举猫狗案例，1000万张猫，1000万张狗，Alpha蚂蚁这个时候去观察这些猫猫狗狗的信息，找出它们相应共有的特征，这样，将这些猫狗图片就能进行分类识别了。

半监督学习：结合监督学习和无监督学习，如何利用少量有标签的样本和大量没有标签的样本进行分类

突然一个时候，告诉你只有3张猫的图片，和三张狗的图片，剩下的猫狗图片有很多，但是没做分类，不知道是猫还是狗，Alpha蚂蚁没办法了，这么少的图片，肯定没法去训练，那该怎么办，先就用半监督学习，利用这6张图进行监督学习的分类训练，再利用剩下的没有标签的图片进行无监督训练，最终达到给一张图片就能识别是猫还是狗的分类。

强化学习：让计算机完成一个从未接触过的任务，提供相应的规则，让计算机自己去总结和学习

现在为止，Alpha蚂蚁已经十分强大了，能干很多事，但是，现在要把Alpha蚂蚁训练成为一个投篮高手，但是投篮是一个很多样化的操作，不太好提供数据训练，那么怎么办？就让Alpha蚂蚁自己去投篮，不管你用什么方式，投篮进去了奖励你吃一个苹果（这可是Alpha蚂蚁最喜欢的水果），进不去就扇Alpha蚂蚁一嘴巴子（被虐待的好惨）；Alpha蚂蚁就自己在那里练习投篮，通过不断的练习，Alpha蚂蚁最终掌握了最好的投篮方式，命中率也越来越高，最终成为了投篮高手！没错，AlphaGo就是这么玩的。

遗传算法：模拟进化理论，淘汰弱智，保留强者

Alpha蚂蚁要是一直练不会投篮怎么办呢？它就是一个不合格的投篮者，永远练不会怎么办。那就这样，淘汰这货，再生出1个更优的Alpha蚂蚁一代，依次进行淘汰，淘汰弱智，保留强者，这样就训练出了一个终极的Alpha蚂蚁N代，这是一个非常非常牛逼的新生代，是Alpha蚂蚁的重重重重重重重重重重重重重重重重孙子。

至此，我们就把机器学习的基本内容讲完了，并未涉及任何算法，希望能让大家对机器学习感兴趣，研究相应的实现！

小白都理解的人工智能系列（1）——理解机器学习

猜你喜欢