百度PARL初探 - 代码天地

百度PARL初探

其他 2020-06-25 10:34:44 阅读次数: 0

强化学习是近些年最火，最接近“真实情况”的深度学习方式。对比其他学习注重的是决策问题，通过智能体与周边环境的交互学会了如何能获得更多的奖励。

百度的paddle团队开源了强化学习PARL项目，该项目有几大特性：

在实际任务中尝试使用强化学习解决问题
快速调研下不同强化学习算法在同一个问题上的效果
搭建分布式强化学习训练平台
加速python多线程代码

这些特性是在实际开发中真实需要的，PARL库内置了很多强化学习算法，可以对轻量级问题进行很好的测试，找寻basseline。

PARL的多线程也是令人兴奋的特性，这可以使python原有的多线程起到真正的作用。

附录：课表

一、强化学习(RL)初印象

RL 概述、入门路线
实践：环境搭建
课后作业：搭建GYM环境+PARL环境，把QuickStart 跑起来

二、基于表格型方法求解RL

MDP、状态价值、Q表格
实践： Sarsa、Q-learning代码解析，解决悬崖问题及其对比
课后作业：使用Q-learning和Sarsa解决16宫格迷宫问题。

三、基于神经网络方法求解RL

函数逼近方法
实践：DQN代码解析，解决CartPole问题
课后作业：使用DQN解决 MountianCar问题

四、基于策略梯度求解RL

策略近似、策略梯度
实践：Policy Gradient算法理解、代码解析，解决CartPole问题
课后作业：使用Policy Gradient解决Atari的Pong问题

五、连续动作空间上求解RL

连续动作空间、DDPG算法介绍
PARL DDPG代码解析
大作业题目：RLSchool 飞行器仿真环境介绍

猜你喜欢

转载自www.cnblogs.com/MyBlog-MrY/p/13190594.html

百度PARL初探

[深度学习工具]·百度PaddlePaddle深度强化学习框架PARL

百度正式发布PaddlePaddle深度强化学习框架PARL

强化学习DQN算法实战之CartPole（百度PARL）

百度统计个人初探

百度熊掌号初探

百度语音识别API初探

百度语音识别初探

C#调用百度大脑API初探2

C#调用百度大脑API初探1

C#调用百度大脑API初探3

初探机器学习之使用百度AI服务实现图片识别与相似图片

可恶的百度

百度地图

百度API

百度广告

百度LBS

百度bae

百度的Ueditor

百度也流氓

百度MTC

百度联盟

百度定位

百度指数

B是百度!

百度主页

百度

百度推广

SEO百度

百度面试

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)