一、人工智能、机器学习、深度学习

1.1 人工智能、机器学习

人工智能：1980年代达到高峰的是专家系统，符号AI是之前的，但不能解决模糊、复杂的问题。

机器学习是把数据、答案做输入，规则作输出。而传统的是把数据、规则作输入，答案作输出。和统计学有关，但是比统计学解决问题更加复杂。

机器学习三要素：

机器学习中的「学习」，就是指寻找更好的表达。

深度学习（Deep learning）中的深度，是指递进式层级的表达。层数，就是深度。层数一般10层到数百层不等。

而非深度学习，被称为浅度学习（shallow learning）。

深度学习的层，常和神经网络有关。（神经网络和生物学的大脑神经没半毛钱关系。）可将层，视为过滤器，一层一层过滤，最后一层输出的是纯净物。

每一层都有权重，找到权重很难。但目标和输入之间的距离，用损失函数（目标函数）来衡量。这样来调节权重。这就是反馈算法，深度学习算法的核心。

于是，开始时候随便给个权重，这样第一次的结果，和Y之间就有一个差距（第一次很大），这样就调节权重，进行第二次，再算出差距，循环往复。

AI经历了两轮寒冬，不要被媒体的过分宣传引导。要避免铁锤人倾向，可以学一些其他的机器学习算法。概率模型（朴素贝叶斯、逻辑回归）这些经常用于分类。

核心算法是一系列的分类算法，支持向量机就是一种（SVM），SVM处理小数据比较好，但是像图像这样的大数据就不行了，而且是浅算法，一开始需要人为操作。

扫描二维码关注公众号，回复： 6259638 查看本文章

随机森林是把决策树给聚合在一起，在kaggle上，一度是最流行的算法，后来被gradient boosting machine取代

之所以深度学习脱颖而出，不仅仅因为其表现较好，更是因为可以自动完成其他机器学习需要手动完成的一步——特征工程。

Kaggle中，gradient boosting machine 和deep learning两种在2016,2017最流行。

gradient boosting machiens 用于结构化数据，是浅算法，使用XGBboost库。而deep learning使用Keras。

硬件在2000以来飞速发展，但是还不足以支撑关于图像、语言处理，但NVIDIA的cuda可用。