强化学习笔记整理

强化学习

        强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习范式方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题 。

        监督学习好比有个老师来指导,告诉你什么是对什么是错,但是强化学习是没有老师指导的,它只能从经验中去学习,它只能试着去做某一件事,它也不知道对错,只有做完才知道对错,然后这样不断地进行学习。 如果一个任务,人也不知道怎么做,那人不知道怎么做就没有标签数据,这个时候强化学习就非常适合这种情况。

        以下是我整理的资料,仅供参考。

以按顺序整理如下:

强化学习的简单理解 - 知乎

能否介绍一下强化学习(Reinforcement Learning),以及与监督学习的不同? - 知乎 

强化学习(Reinforcement Learning)知识整理 - 知乎

第四范式强化学习Studio,低门槛构建强化学习场景

飞桨AI Studio - 人工智能学习与实训社区

GAN(Generative-Adversarial Network)

生成对抗网络GAN和强化学习RL有什么紧密联系? - 知乎

https://www.baidu.com/link?url=dDQ3KgATzBhiPDd-W_iW6zryBx1o5pQvTNzhMGN7bjiVPZNmhZ4eQz5e8WMESu_eA33OqiUo4Z1LUChoYbkd-I8JcJ-tdPXGD8W1zXypRbC&wd=&eqid=a85321dc0006297500000003619f56b2 

 paddle 里面的强化学习教程是真适合初学者,强烈推荐。

おすすめ

転載: blog.csdn.net/weixin_43332715/article/details/121542577