1. 深度学习介绍

1.1 AI地图

① 如下图所示，X轴是不同的模式，最早的是符号学，然后概率模型、机器学习。Y轴是我们想做什么东西，感知是我了解这是什么东西，推理形成自己的知识，然后做规划。

② 感知类似我能看到前面有个屏幕，推理是基于我看到的东西想象未来会发生什么事，根据看到的现象、数据，形成自己的知识，知道所有知识后能进行长远的规划，未来怎么做。

① 自然语言处理目前还是停留在感知上，人几秒钟能反应过来的东西都属于感知范围，即使像中文翻译成英文，英文翻译成中文那种。

② 计算机视觉可以在图片里面可以做一些推理。

③ 自然语言处理里面有符号，所以有符号学，并且还可以用概率模型、机器学习。计算机视觉面对的是图片，图片里面都是一个个像素，像素很难用符号学来解释，所以计算机视觉大部分用概率模型、机器学习来解释。

④ 深度学习是计算机视觉中的一种方法，它还有其他应用方法。

① 深度学习最早在图片分类上做了比较大的突破。

② IMAGENET是比较大的图片分类数据集，如下图所示，它包括了一千类的自然物体的图片，它大概有一百万张图片。

① 可以看到从12年开始，图片分类错误率开始有一个比较大的下降，12年就是深度学习引入图片分类的开始。

② 17年的时候，几乎所有的团队都可以做到5%以内的错误率，基本上可以达到人类在图片识别上的精度了。可以说在图片分类上，深度学习已经做的很好了。

① 知道图片是内容，在什么地方，这就是物体检测。

② 物体分割是指每个像素它到底是飞机还是人。

① 内容图片结合样式图片(滤镜)，可以把内容图片映射到其他风格。

① 下面的所有图都为算法合成的假人脸。

① 下面的图片都是由上面的文字生成出来的。

① 下左图为算法会根据人问的问题，机器生成回答。

② 下右图为机器根据人的需求，给我们写代码。

① 下图为计算机视觉的无人驾驶领域的应用。

① 根据用户的点击，看给怎么样的广告。