深度强化学习（资源篇） - 代码天地

深度强化学习（资源篇）

其他 2019-01-18 01:30:49 阅读次数: 0

理论
深度强化学习从入门到大师：以刺猬索尼克游戏为例讲解PPO（第六部分）
深度强化学习从入门到大师：简单介绍A3C （第五部分）
深度强化学习从入门到大师：以 Cartpole 和 Doom 为例介绍策略梯度（第四部分）
深度强化学习从入门到大师：进一步了解深度Q学习（第三部分 - 下）
深度强化学习从入门到大师：以Doom为例一文带你读懂深度Q学习（第三部分 - 上）
深度强化学习从入门到大师：通过Q学习进行强化学习（第二部分）
深度强化学习从入门到大师：简介篇（第一部分）
学习何时做分类决策，深度好奇提出强化学习模型Jumper
NIPS 2018 | Spotlight论文：凭借幻想的目标进行视觉强化学习
 伯克利、OpenAI等提出基于模型的元策略优化强化学习
 自学习 AI 智能体第二部分：深度 Q 学习
 自学习 AI 智能体第一部分：马尔科夫决策过程
 滴滴 KDD 2018 论文详解：基于强化学习技术的智能派单模型

项目
强化学习工具Horizon开源：Facebook曾用它优化在线视频和聊天软件
 开源啦：连DeepMind也捉急的游戏，OpenAI给你攻破第一关的高分算法
 如何保持运动小车上的旗杆屹立不倒？TensorFlow利用A3C算法训练智能体玩CartPole游戏

资讯
DeepMind推出深度学习与强化学习进阶课程（附视频）
MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)
伯克利CS294深度强化学习课程资料放出（PPT+录像）
BAIR讲述如何利用深度强化学习控制灵活手
 你需要新的好奇心方法克服强化学习中的拓展症
 EMNLP 2018 | 用强化学习做神经机器翻译：中山大学&MSRA填补多项空白
 人人能上手：OpenAI发射初学者友好的强化学习教程 | 代码简约易懂
 「多巴胺」来袭！谷歌推出新型强化学习框架Dopamine
超越DQN和A3C：深度强化学习领域近期新进展概览
 Facebook开源首个适应大规模产品的强化学习平台Horizon，基于PyTorch 1.0
深度强化学习中的好奇心
 MILA 2018夏季深度学习与强化学习课程资源大放送
 《深度强化学习》手稿开放了！
DeepMind 开源TRFL，又一个强化学习复现、创新好帮手
 OpenAI开课了！深度强化学习最全课程包，教程、代码、习题、文档一网打尽
 让机器帮你做决策！强化学习在智能交互搜索的应用分享

猜你喜欢

转载自blog.csdn.net/weixin_44356285/article/details/86005061

深度强化学习（资源篇）

深度强化学习：资源以及思考。

深度强化学习资源介绍

深度强化学习

深度强化学习的入门资源汇总-2016.8

资源 | 《深度强化学习》手稿开放了！

强化学习学习资源

深度学习-强化学习

【学习】深度强化学习

强化学习资源列表

深度强化学习之DQN算法基础篇。

深度强化学习- 最全深度强化学习资料

深度强化学习DQN

深度强化学习汇总

对深度强化学习的理解

深度强化学习剖析

深度强化学习—DQN

深度强化学习概述

深度强化学习笔记

深度强化学习的未来

深度强化学习DLR

什么是深度强化学习？

深度强化学习整理

深度强化学习（深度Q学习

核心【深度学习+深度强化学习】

深度强化学习1——强化学习到深度强化学习

深度强化学习——强化学习到深度强化学习

深度强化学习系列（一）：强化学习概述

深度强化学习系列（二）：强化学习基础

强化学习及深度强化学习面试题

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)