1. 深度学习介绍

1.1  AI地图

① 如下图所示,X轴是不同的模式,最早的是符号学,然后概率模型、机器学习。Y轴是我们想做什么东西,感知是我了解这是什么东西,推理形成自己的知识,然后做规划。

② 感知类似我能看到前面有个屏幕,推理是基于我看到的东西想象未来会发生什么事,根据看到的现象、数据,形成自己的知识,知道所有知识后能进行长远的规划,未来怎么做。

① 自然语言处理目前还是停留在感知上,人几秒钟能反应过来的东西都属于感知范围,即使像中文翻译成英文,英文翻译成中文那种。

② 计算机视觉可以在图片里面可以做一些推理。

③ 自然语言处理里面有符号,所以有符号学,并且还可以用概率模型、机器学习。计算机视觉面对的是图片,图片里面都是一个个像素,像素很难用符号学来解释,所以计算机视觉大部分用概率模型、机器学习来解释。

④ 深度学习是计算机视觉中的一种方法,它还有其他应用方法。

1.2 IMAGENET数据集

① 深度学习最早在图片分类上做了比较大的突破。

② IMAGENET是比较大的图片分类数据集,如下图所示,它包括了一千类的自然物体的图片,它大概有一百万张图片。

 1.3 图片分类错误率

① 可以看到从12年开始,图片分类错误率开始有一个比较大的下降,12年就是深度学习引入图片分类的开始。

② 17年的时候,几乎所有的团队都可以做到5%以内的错误率,基本上可以达到人类在图片识别上的精度了。可以说在图片分类上,深度学习已经做的很好了。

1.4  物体检测和分割

① 知道图片是内容,在什么地方,这就是物体检测。

② 物体分割是指每个像素它到底是飞机还是人。

 1.5 样式迁移

① 内容图片结合样式图片(滤镜),可以把内容图片映射到其他风格。

 1.6 人脸合成

① 下面的所有图都为算法合成的假人脸。

 1.7 文字生成

① 下面的图片都是由上面的文字生成出来的。

 1.8 文字生成

① 下左图为算法会根据人问的问题,机器生成回答。

② 下右图为机器根据人的需求,给我们写代码。

 1.9 无人驾驶

① 下图为计算机视觉的无人驾驶领域的应用。

 1.10 广告点击

① 根据用户的点击,看给怎么样的广告。

 

 

 

 1.11 领域专家、数据科学家、AI专家

猜你喜欢

转载自blog.csdn.net/qq_54932411/article/details/132522395
今日推荐