人工智能

人工智能（artificial intelligence），这个话题很广，涉及的领域也很广。这一个领域还处于起步阶段，每个人都会有不同的理解，那么这里对AI的一个分支做简单的讨论。
在这里插入图片描述

什么是人工智能？

人工智能通俗的来说就是能让机器模仿与学习人类的技能，并且以这些技能更高效与准确的处理问题。
人工智能再往细划分又有机器学习、深度学习。具体的关系如下图：
在这里插入图片描述
AI的水很深，可能再有一段时间发展，深度学习又会有新的领域。本文单是以机器学习为主题展开讨论。

什么是机器学习？

机器学习与上面的人工智能解释很相似，当然这也是作者个人的理解。
机器学习就是通过编程实现问题A，然后依靠实现问题A的经验，让机器去实现问题B，其中有一个准确率，然后通过在大量的实现问题中学习并且提高准确率。
这个样的过程也就是通常所说的不断训练模型，提高模型的准确度。
在这里插入图片描述

机器学习能做什么？

下面一张图能简明扼要的概括机器学习能用到的领域：
在这里插入图片描述
医疗、人脸识别、自动驾驶等。当然其中更多的是深度学习。
下面还有这样一个贴近大家生活的场景：

像这样的垃圾短信大家都不陌生，除此之外还有邮件。
然而机器学习通过大量的数据学习，能够根据信息的内容分析判断接收到信息是不是垃圾短信，然后做一个分类或者删除处理。

机器学习部分术语概念

在这里插入图片描述
监督学习：有标签结果。简单的来说就是训练模型后会有正确答案做比较。
这个主要用于做数据的预测，例如房价、股票的预测
无监督学习：无标签结果。就是让程序自己对数据进行抱团分类。这个的
用途就是上面说到的垃圾短信的归类。
在这里插入图片描述
这个是处理的数据中的一些术语。
样本、样例：指的是一条数据（比如用于机器学习的一条短信数据）
属性、特征：处理数据选取的特点。（如垃圾短信中的某些文字）
样本空间：所有样本的大小。

误差：程序根据模型得出的结果与正确结果之间的对比。
过拟合：指的是模型会设计到每一个样本点，但是模型的抖动很大（线性回归中经过所有点的线）。
在这里插入图片描述
留出评估法：指的是把数据划分，分成训练集与测试集两个部分。即数据自身的一部分用于程序训练学习，另一部分用于与模型对比。

交叉评估法（又称K折法）：把样本数据划分为K份，训练出来的结果分别与每一份数据对比，然后把各个误差取均值