第一章:深度学习引言

目录

Part one.人工智能、机器学习和深度学习

一、人工智能

1.人工智能定义

2.人工智能分类

二、机器学习

1.机器学习定义

2.机器学习分类

3.常见的机器学习方法

三、深度学习

1.深度学习定义

2.深度学习分类

3.为什么使用深度学习

4.深度学习方法概貌

5.深度学习主要应用

Part Two.中英文术语对照



Part one.人工智能、机器学习和深度学习

一、人工智能

1.人工智能定义

研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新兴学科。

2.人工智能分类

弱人工智能:认为不可能制造出能真正进行推理和解决问题的智能机器,这些机器看起来像智能的,但是并不真正拥有智能,也不会有自主意识(悲观派)

强人工智能:认为有可能制造出真正能推理和解决问题的智能机器,这样的机器被认为是有自主意识的 (乐观派)

超级人工智能:机器的智能彻底超过了人类(超乐观派)

二、机器学习

1.机器学习定义

让计算机具有像人一样的学习和思考能力的技术的总称。具体来说是从已知数据中获得规律,并利用规律对未知数据进行预测的技术

2.机器学习分类

有监督学习(Supervised Learning):有老师(环境)的情况下,学生(计算机)从老师(环境)那里获得对错指示、最终答案的学习方法。跟学师评。简言之数据集有标签。例如:分类、回归

无监督学习( Unsupervised Learning):没有老师(环境)的情况下,学生(计算机)自学的过程,一般使用一些既定标准进行评价。自学标评。简言之数据集没有标签 。例如:聚类、降维

强化学习(Reinforcement Learning):没有老师(环境)的情况下,学生(计算机)对问题答案进行自我评价的方法,重点是能够从环境中得到反馈。自学自评。简言之大部分数据集没有标签,少部分数据集有标签。例如:对弈

3.常见的机器学习方法

        

三、深度学习

1.深度学习定义

深度学习一般是指通过训练多层网络结构对未知数据进行分类回归

2.深度学习分类

有监督学习方法:深度前馈网络、卷积神经网络、循环神经网络等

无监督学习方法:深度信念网、深度玻尔兹曼机,深度自编码器,生成对抗网络等

3.为什么使用深度学习

        

比如说我们要做一个classification,这个任务是我要区分这是不是一个车。现实中,可能有不同大小的不同角度的车的图像,车会有不同的尺度,不同的方向,甚至不同的颜色之类的。要分出这个车,就要知道这个结构,因此会设计一些feature,比如说我们最常用的车的一个feature是seat。为了克服这种不同尺度以及不同角度,需要这个找到他的局部极大值,然后在这个极大值上面,用它的梯度的直方图来表示它的结构,这个梯度直方图就可以表现他的边缘的方向以及他的统计分布特性。然后把这个特征放在一个机器学习的模型里,比如说很常用的SVM,然后进行训练和分类。

那这里面,影响机器学习性能的因素变成了两个:第一个是模型合不合适,比如SVM里面有不同的参数的选取,当然这个可以通过以目的为驱动的训练来尽可能的逼近最好的结果;第二个因素是特征的表示,如果这个特征不能很好地表示这个物体,或者是实现这个应用,那即使后面的模型再好,也很难得到很好的性能。比如在这里我不用seat,只用颜色。但是颜色完全不可能判别这个是不是一个车,所以你即使用再好的分类器,也不可能把车分类出来。你后面即使是用卷积网络之后特别好,特别多,然后,但是你前面输入的这个信息就完全不可能把它判别的话,那后面再好也不行。所以说在传统的这个机器学习领域,是很依赖于专业人士设计的这些feature的。

但是转到深度学习之后呢,人们就把特征提取和classification合到一起。这两部分都是通过以目的为驱动的训练的方式,比如说这种端到端的训练方式来得到。那这个时候呢,其实我不知道到底我训练出来这个feature是什么样的一个结构,或者是具有什么样的物理意义。我已经不太知道,因为他完全是大数据训练出来的一个过程。这就相当于变成了一个黑盒子,但是这个呢,它在一定程度上是以目的为驱动,如果数据量足够的话,他这个会训练出来在一定程度上表现这个物体(车)最好的特征。因此数据量足够大,而且网络结构也是相对合理的话,判别效果会超过我们传统的人工设计的方式的。

4.深度学习方法概貌

        

5.深度学习主要应用

(1)图像处理领域主要应用 :

  • 图像分类(物体识别):整幅图像的分类或识别
  • 物体检测:检测图像中物体的位置进而识别物体
  • 图像分割:对图像中的特定物体按边缘进行分割
  • 图像回归:预测图像中物体组成部分的坐标

      

(2)语音识别领域主要应用

  • 语音识别:将语音识别为文字
  • 声纹识别:识别是哪个人的声音
  • 语音合成:根据文字合成特定人的语音

(3)自然语言处理领域主要应用

  • 语言模型:根据之前词预测下一个单词。
  • 情感分析:分析文本体现的情感(正负向、正负中或多态度类型)。
  • 神经机器翻译:基于统计语言模型的多语种互译。
  • 神经自动摘要:根据文本自动生成摘要。
  • 机器阅读理解:通过阅读文本回答问题、完成选择题或完型填空。
  • 自然语言推理:根据一句话(前提)推理出另一句话(结论)。

(4)综合应用

  • 图像描述:根据图像给出图像的描述句子
  • 可视问答:根据图像或视频回答问题
  • 图像生成:根据文本描述生成图像
  • 视频生成:根据故事自动生成视频

Part Two.中英文术语对照

❑人工智能:Artificial Intelligence

❑计算智能:Computational Intelligence

❑感知智能:Perceptual Intelligence

❑认知智能:Cognitive Intelligence

❑机器学习:Machine Learning

❑有监督学习:Supervised learning

❑无监督学习:Unsupervised learning

❑增强学习:Reinforcement Learning

❑神经元:Neuron

❑感知器:Perceptron

❑神经网络:Neural Networks

反向传播算法: Back Propagation, BP

❑卷积神经网络:Convolutional Neural Network,CNN

❑深度学习:Deep Learning

❑梯度消失:Vanishing Gradient

❑修正线性单元:Rectified Linear Unit, ReLU

❑深度信度网:Deep Belief Networks

❑玻尔兹曼机:Boltzmann Machines

❑变分学习:Variational Learning

❑分类:Classification

❑递归:Recursion

❑深度信念网络:Deep Belief Network, DBN

 

❑深度玻尔兹曼机:Deep Boltzmann Machine, DBM

❑深度自编码器: Deep Auto-Encoder, DAE

❑降噪自编码器: Denoising Auto-Encoder, D-AE

❑栈式自编码器: Stacked Auto-Encoder, SAE

❑生成对抗网络: Generative Adversarial Networks,GAN

❑非参数贝叶斯网络: Non-parametric Bayesian Networks

❑深度前馈网络: Deep Feedforward Neural Network, D-FNN

❑卷积神经网络: Convolutional Neural Network, CNN

❑循环神经网络: Recurrent Neural Network, RNN

❑胶囊网络: Capsule Net

❑深度森林: Deep Forest

 

❑图像分类(物体识别): Image Classification (Object Recognition)

❑物体检测:Object Detection

❑图像分割:Image Segmentation

❑图像回归:Image Regression

❑语音识别:Automatic Speech Recognition, ASR

❑声纹识别:Voiceprint Recognition

❑语音合成:Speech Synthesis

❑语言模型:Language Model

❑情感分析:Sentiment Analysis

❑神经机器翻译:Neural Machine Translation, NMT

❑神经自动摘要:Neural Automatic Summarization

❑机器阅读理解:Machine Reading Comprehension, MRC

❑自然语言推理:Natural Language Inference, NLI

❑文本蕴含:Text Entailment

发布了23 篇原创文章 · 获赞 23 · 访问量 23万+

猜你喜欢

转载自blog.csdn.net/weixin_40645361/article/details/104887212