监督学习、无监督学习、弱监督学习、半监督学习、强化学习概念

监督学习

训练集的数据都是有标签的数据,在输入数据时,我们知道这个数据对应的输出,模型不断的建模数据输入和输出之间的关系。

不断的调整模型,缩小与真是输出的loss,直到输入输出一致。比如已知一些图片是猫,一些图片不是猫,那么训练一个算法,当一个新的图片输入算法的时候算法告诉我们这张图片是不是猪。

无监督学习

训练的数据没有分类,希望模型自动的将数据按照自己学到的特征进行分类,比如输入猫和狗的图片,但是并不知道那一张对应的是什么,希望模型自动可以判别那一张是猫,那一张是狗。

弱监督学习

训练的数据有一个弱标签,希望通过深度学习,得到一个强标签。

比如说,知道一张图片是一只猫,通过训练知道猫在那里,将猫和背景分离开来。

半监督学习

是监督学习和无监督学习的合并。待补充。

强化学习

扫描二维码关注公众号,回复: 5781345 查看本文章

学习的是一个策略,输出的是一个序列,不断的达到最终的结果,一个动作如果是好的策略的组成部分,它就是好的动作。

系统在没有人为指导的情况下,通过不断的试错来提升任务性能的过程。对学习过程有记忆,可以通过以往好的动作来决定下一步动作。比如:下棋游戏,不知道每一步是对还是错,但是知道一系列决策后最终的结果是输还是赢。

参考:https://blog.csdn.net/limiyudianzi/article/details/78921450

参考:https://www.jianshu.com/p/d1c97a4d2e70

猜你喜欢

转载自blog.csdn.net/qq_40168949/article/details/84873132