深度学习中的强化学习和对抗学习

在人工智能中，有两个十分重要的内容，第一就是机器学习，第二就是深度学习。正是由于机器学习与深度学习，人工智能才能够帮助我们做出更多的事情。其实，深度学习也是有分类的。深度学习可以分为两种，一种是强化学习，另一种则是对抗学习。在这篇文章中我们就简单为大家介绍一下强化学习和对抗学习的知识。

其实强化学习和对抗学习，相对来说，都是深度学习比较前沿的部分。一般来说，强化学习是人工智能在训练中得到策略的训练过程，强化学习强调的是一个过程，而不同于上述各种神经网络强调的是搭建模型的方式。可能会有朋友问，强化学习要解决的问题是什么？说到这里我们就不得不提一下神经网络，神经网络大部分是在完成分类问题，判断样本标签类别等，机器做到更智能表现就是因为强化学习，强化学习就作为一种机器自学习的状态，来解决上面神经网络相对来说需干预才可学习的局限。比如在阿尔法狗围棋学习中，就会用到强化学习这样的自学习过程。

那么强化学习的模型核心是什么呢？其实强化学习要做的主要有两步，第一就是将奖励、损失定义好。第二就是以主体较低成本不断尝试，总结不同状态下，奖励大的工作方式。

下面我们就给大家介绍一下对抗学习的知识，目前的对抗学习主要是指生成对抗网络。对抗网络是通过模拟一种数据概率分布的生成器，使得概率分布与观测数据的概率统计分布一致或者尽可能接近。这个过程涉及纳什均衡中的博弈机制，具体包括在训练中，判别模型尽可能提取特征正确率增加的模型，生成模型尽可能“伪造”让判别模型以为是真的结果。其他，还有相对更前沿的，包括条件生成对抗网络（CGAN）、深度卷积对抗网络（DCGAN）等等。这些前沿方向，对应解决的，包括对抗学习稳定性不高、训练数据还原度及质量水平等问题。这些就是对抗学习的内容。

在这篇文章中我们给大家介绍了很多有关于深度学习的内容，具体的内容就是给大家介绍的强化学习和对抗学习的知识。当然，这些都是深度学习中的前沿知识，要想学习得更加深入和熟练，真的就得一步一个脚印地好好掌握。希望这篇文章能够帮助到大家。

深度学习中的强化学习和对抗学习

猜你喜欢