人工智能
人工智能(artificial intelligence),这个话题很广,涉及的领域也很广。这一个领域还处于起步阶段,每个人都会有不同的理解,那么这里对AI的一个分支做简单的讨论。
什么是人工智能?
人工智能通俗的来说就是能让机器模仿与学习人类的技能,并且以这些技能更高效与准确的处理问题。
人工智能再往细划分又有机器学习、深度学习。具体的关系如下图:
AI的水很深,可能再有一段时间发展,深度学习又会有新的领域。本文单是以机器学习为主题展开讨论。
什么是机器学习?
机器学习与上面的人工智能解释很相似,当然这也是作者个人的理解。
机器学习就是通过编程实现问题A,然后依靠实现问题A的经验,让机器去实现问题B,其中有一个准确率,然后通过在大量的实现问题中学习并且提高准确率。
这个样的过程也就是通常所说的不断训练模型,提高模型的准确度。
机器学习能做什么?
下面一张图能简明扼要的概括机器学习能用到的领域:
医疗、人脸识别、自动驾驶等。当然其中更多的是深度学习。
下面还有这样一个贴近大家生活的场景:
像这样的垃圾短信大家都不陌生,除此之外还有邮件。
然而机器学习通过大量的数据学习,能够根据信息的内容分析判断接收到信息是不是垃圾短信,然后做一个分类或者删除处理。
机器学习部分术语概念
监督学习:有标签结果。简单的来说就是训练模型后会有正确答案做比较。
这个主要用于做数据的预测,例如房价、股票的预测
无监督学习:无标签结果。就是让程序自己对数据进行抱团分类。这个的
用途就是上面说到的垃圾短信的归类。
这个是处理的数据中的一些术语。
样本、样例:指的是一条数据(比如用于机器学习的一条短信数据)
属性、特征:处理数据选取的特点。(如垃圾短信中的某些文字)
样本空间:所有样本的大小。
误差:程序根据模型得出的结果与正确结果之间的对比。
过拟合:指的是模型会设计到每一个样本点,但是模型的抖动很大(线性回归中经过所有点的线)。
留出评估法:指的是把数据划分,分成训练集与测试集两个部分。即数据自身的一部分用于程序训练学习,另一部分用于与模型对比。
交叉评估法(又称K折法):把样本数据划分为K份,训练出来的结果分别与每一份数据对比,然后把各个误差取均值
自助法:随机抽取数据对比,并且有放回。
机器学习中的部分算法
分类算法:根据多种数据中的特征来对其分类
线性回归:如初中所学的公式y = kx+b.(用于房价、票房的预测)数据的展示如下:
聚类与关联:找出数据中的某些规律。对其归并分类(如新闻与另外一个新闻是否有联系)
当然,还有强化学习的一些算法。这里就不展开了。
碍于篇幅过长,省去了很多点。当然也可能是作者涉及的知识还不够。此处留个坑,日后来填。
以上是作者对机器学习冰上一角的理解,也算是个人学习的一个笔记。不妥之处还望指出!