Q-learning算法汇总 - 代码天地

Q-learning算法汇总

其他 2020-04-07 08:40:47 阅读次数: 0

https://blog.csdn.net/itplus/article/details/9361915经典的六个房间解释算法
http://blog.sina.com.cn/s/blog_151a90a3b0102xg0p.html上面的可复制版本
https://www.jianshu.com/p/29db50000e3f 上面算法的python实现
https://blog.csdn.net/weixin_32759777/article/details/104163272?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1上面算法的另一个python实现
https://blog.csdn.net/count_on_me/article/details/82952391?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task上面算法的matlab实现（没试过不知道是否可行）
https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/2-1-A-q-learning/莫凡简单带你了解一下
https://blog.csdn.net/qq_36124802/article/details/79882269莫凡的小案例的代码详细注释版本
https://blog.csdn.net/Fitz_p/article/details/82975129?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task今天给大家分享如何用Q_learning算法来实现走迷宫,我们的红色方块会一次次的尝试不同的格子,直到落入黑格子,获得惩罚1;或者走进黄格子,获得奖励1为止。每一次游戏都会更新Q_table的权重，以实现红色方块下一次能够更加快速的找到黄格子。代码注释版本

lilisad

发布了1 篇原创文章 · 获赞 0 · 访问量 6

私信关注

猜你喜欢

转载自blog.csdn.net/lilisad/article/details/105355548

Q-learning算法汇总

Q-learning算法实现

Q-learning算法介绍

Q-Learning算法学习

Q-learning与Sarsa算法的区别

Q-learning算法实现1（matlab）

强化学习-Q-Learning算法

强化学习——Q-learning算法

Q-learning算法介绍（1）

Q-learning算法介绍（2）

进阶阶段（一）——Q-Learning算法

Q-Learning 、Sarsa与 DQN算法

强化学习算法学习汇总笔记 (一) — Q-learning、Sarsa、DQN、Policy Gradients

A Painless Q-learning Tutorial (一个 Q-learning 算法的简明教程)

Q-Learning demo

Q-Learning

什么是 Q-learning

Q-Learning code

Reinforcement Learning学习笔记|Q-learning算法

强化学习(五)：Sarsa算法与Q-Learning算法

【强化学习】Q-Learning算法详解

一个 Q-learning 算法的简明教程

机器学习之Grid World的Q-Learning算法解析

强化学习之Q-learning算法

强化学习算法：Q-learning与Sarsa（区别与联系）

强化学习——Q-Learning算法原理

机器学习笔记 - Deep Q-Learning算法概览

Q-Learning, Double DQN与 Dueling DQN算法详解

Q-learning 例子注释

Q-learning学习笔记

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)