强化学习-Q-learning学习笔记 - 代码天地

强化学习-Q-learning学习笔记

其他 2019-02-23 10:47:59 阅读次数: 0

Q学习动作探索策略中的ep-greepy,以ep的概率进行随机探索，以1-ep的概率以最大值策略进行开发，因为设定的迭代次数比较多，所以肯定存在一定的次数去搜索不同的动作。

1）Python版本

b站上的学习教程https://blog.csdn.net/qq_36124802/article/details/79882269，其中的pandas，np是数据处理包。使用其他语言也是可以的，用矩阵代替，主要是用多维矩阵保存数据，然后对矩阵进行计算处理。

2）c语言版本

https://blog.csdn.net/qq_23144435/article/details/80368635

3）C++版本

https://github.com/jinfagang/Q-Learning/blob/master/main.cpp

4）一个完整的unity demo项目，使用c# 语言

https://github.com/Unity-Technologies/Q-GridWorld/tree/master/Assets

猜你喜欢

转载自www.cnblogs.com/dingxiaoqiang/p/10421789.html

强化学习笔记：Q-learning

强化学习-Q-learning学习笔记

强化学习 Q-learning

强化学习之Q-learning

强化学习-Q-learning

强化学习-Q-Learning算法

强化学习Q-learning

强化学习——Q-learning算法

强化学习Q-learning实践

强化学习Q-learning入门

强化学习 Q-learning 小例子

【强化学习】Q-Learning算法详解

强化学习之Q-learning简介

强化学习(五)：Sarsa算法与Q-Learning算法

[ 强化学习 ] —— 基础知识：(1) Q-learning

强化学习之Q-learning算法

王权富贵：强化学习Q-learning

强化学习Q-learning 和 Sarsa

【强化学习】python 实现 q-learning 例二

【强化学习】python 实现 q-learning 例三

通过 Q-learning 深入理解强化学习

强化学习（一）Q-Learning/DQN之CartPole

强化学习（五）——Sarse和Q-learning

强化学习Q-learning的理解与python实现

强化学习算法：Q-learning与Sarsa（区别与联系）

强化学习之Q-Learning（附代码）

强化学习 Q-learning 实例详解

强化学习——Q-Learning算法原理

强化学习Q-learning、DCN和PPO

强化学习之CartPole游戏(Q-learning)

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)