现在我们谈的人工智能大多数都是指的是机器学习，下面我就介绍一下关于机器学习等一些概念及学习路线。

1.人工智能概念

人工智能、机器学习与深度学习

1.人工智能
网上关于人工智能的介绍的有很多说法，不过在《计算机科学导论》原书是这样说的
在这里插入图片描述
想深入了解的话，可以找度娘或者去找一些关于AI综述的论文看看，这里就不在深入介绍，毕竟这篇博客是给我们这种小白看的。

2.机器学习
机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径。它的应用已遍及人工智能的各个分支，如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。其中尤其典型的是专家系统中的知识获取瓶颈问题，人们一直在努力试图采用机器学习的方法加以克服。

3.深度学习
深度学习是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入，通过非线性激活方法取权重，再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样，通过合适的矩阵数量，多层组织链接一起，形成神经网络“大脑”进行精准复杂的处理，就像人们识别物体标注图片一样。

深度学习是从机器学习中的人工神经网络发展出来的新领域。早期所谓的“深度”是指超过一层的神经网络。但随着深度学习的快速发展，其内涵已经超出了传统的多层神经网络，甚至机器学习的范畴，逐渐朝着人工智能的方向快速发展。

上面还说专门给小白看的，画风转的太快了哈。

不过知乎上面有个对这三者区别及联系解释的高赞文章，可以去看看，https://www.zhihu.com/question/57770020，感兴趣可以去看看，写的确实挺好的。

模式识别

1.什么是模式识别
模式识别是指人类的一项基本智能，在日常生活中，人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代人工智能的兴起，人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。（计算机）模式识别在20世纪60年代初迅速发展并成为一门新学科。

模式识别是指对表征事物或现象的各种形式的（数值的、文字的和逻辑关系的）信息进行处理和分析，以对事物或现象进行描述、辨认、分类和解释的过程，是信息科学和人工智能的重要组成部分。
　　
模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读，把环境与客体统称为“模式”。随着计算机技术的发展，人类有可能研究复杂的信息处理过程，其过程的一个重要形式是生命体对环境及客体的识别。

扫描二维码关注公众号，回复： 12324357 查看本文章

模式识别以图像处理与计算机视觉、语音语言信息处理、脑网络组、类脑智能等为主要研究方向，研究人类模式识别的机理以及有效的计算方法。

这里也推荐一篇博客，对模式识别也介绍的很形象，https://blog.csdn.net/eternity1118_/article/details/51105659

2.几种常⻅模式识别算法整理和总结
这里就不介绍了，毕竟这篇博客只介绍一些基础知识。
这里也推荐一篇博客：https://blog.csdn.net/scyscyao/article/details/5987581?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase

预测任务

通俗点讲就是通过已知信息得到未知信息。例如在银行业，通过客户的个人信用信息来评价个人的借贷⻛险。

在预测任务中，我们希望模型尽可能地精确，相反预测模型f的形式可能是一个黑箱模型(即模型的本身我们不能很好的解释或者并不清楚，我们更加关心这当中的输入和输出，并不试图考察其内部结构)，只要能够提高我们的预测精度我们就认可达到目的了。一般认为，神经网络模型属于黑箱模型，如几年前Google X实验室开发出一套具有自主学习能力的神经网络模型，它能够从一千万中图片中找出那些有小猫的照片。在这里，输入就是这一千万张图片，输出就是对于这些图片的识别。

这里还有一个控制任务，就不再介绍了，这里有篇知乎的文章写的不错，https://www.zhihu.com/question/45536799

分布式

分布式计算是计算机科学中一个研究方向，它研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分，然后把这些部分分配给多个计算机进行处理，最后把这些计算结果综合起来得到最终的结果。分布式网络存储技术是将数据分散地存储于多台独立的机器设备上。分布式网络存储系统采用可扩展的系统结构，利用多台存储服务器分担存储负荷，利用位置服务器定位存储信息，不但解决了传统集中式存储系统中单存储服务器的瓶颈问题，还提高了系统的可靠性、可用性和扩展性。

简单点讲就是将数据分散到多个服务器进行数据训练，以满足多数据的算力运算。

容错性

是使系统在部分组件（一个或多个）发生故障时仍能正常运作的能力。
每个服务器有可能出现意外导致数据丢失，系统依然能保持继续运行。

协同过滤

协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息，个人通过合作的机制给予信息相当程度的回应（如评分）并记录下来以达到过滤的目的进而帮助别人筛选信息，回应不一定局限于特别感兴趣的，特别不感兴趣信息的纪录也相当重要。

2.获取数据与特征工程

数据集

训练集:用来拟合模型，通过设置分类器的参数，训练分类模型。
验证集:用以确定模型超参数，选出最优模型。
测试集:仅用于对训练好的最优函数进行性能评估。

离散数据、连续数据

离散变量是指其数值只能用自然数或整数单位计算的则为离散变量.例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得。

在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得。

特征、特征向量、样本、标签

特征是一个客体或一组客体特性的抽象结果。特征是用来描述概念的。任一客体或一组客体都具有众多特性，人们根据客体所共有的特性抽象出某一概念，该概念便成为了特征。在数学中，特征是经典特征函数在局部域上的一种推广。
简单来说：特征是输入变量，即简单线性回归中的 x 变量。

特征向量：
https://blog.csdn.net/woainishifu/article/details/76418176

标签是我们要预测的事物，即简单线性回归中的 y 变量。标签可以是小麦未来的价格、图片中显示的动物品种、音频剪辑的含义或任何事物。

样本：样本（specimen）是观测或调查的一部分个体，总体是研究对象的全部。

递归、迭代、并行

递归(recursion)，指的是一个函数不断调用自身的行为。比如，以编程方式输出著名的斐波纳契数列。（线性递归和尾递归。）

迭代(iterate)，指的是按照某种顺序逐个访问列表中的每一项。比如，for语句。
迭代只能对应集合，列表，数组等。不能对执行代码进行迭代。

并行:多线程

PCA，降维

是一种常⻅的数据分析方式，常用于高维数据的降维，可用于提取数据的主要特征分量。

https://blog.csdn.net/zouxiaolv/article/details/100590725

分布、主题分布、⻓尾分布

LDA处理文档主题分布：
https://www.jianshu.com/p/67ec0762e07a

⻓尾分布：除了正态分布，其他均为⻓尾分布。

特征选择

进行特征选择的主要目的:降维、降低学习任务的难度、提升模型的效率

https://blog.csdn.net/hren_ron/article/details/80914491

常⻅方法:
https://blog.csdn.net/qq_33876194/article/details/88403394

还有矢量、标量、多项式、归一化、正例样本、负例样本、类别集合、待分类项、序列、向量序列、自变量、因变量、分词，分词器、特征提取等等就不一一介绍了。

3.模型训练

梯度下降

梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（Gradient Descent）是最常采用的方法之一，另一种常用的方法是最小二乘法。在求解损失函数的最小值时，可以通过梯度下降法来一步步的迭代求解，得到最小化的损失函数和模型参数值。反过来，如果我们需要求解损失函数的最大值，这时就需要用梯度上升法来迭代了。在机器学习中，基于基本的梯度下降法发展了两种梯度下降方法，分别为随机梯度下降法和批量梯度下降法。

表征学习

将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦，允许计算机学习使用特征的同时，也学习如何提取特征：学习如何学习。

监督学习和非监督学习

https://blog.csdn.net/GodDavide/article/details/102677973

BP神经网络

反向传播的神经网络
https://blog.csdn.net/robert_chen1988/article/details/99237827

过拟合，欠拟合

过拟合:训练集准确率高，测试集准确率特别低；欠拟合:训练集、测试集表现都不好

这里只介绍一些比较常见的基础的在机器学习里面的名词。

写这篇的博客亦是归纳总结，亦是对自己学习路线的一种规划。

待续…

AI入门知识及资料整理

机器学习概念