MCTS-蒙特卡洛树搜索 - 代码天地

MCTS-蒙特卡洛树搜索

其他 2018-07-22 16:14:48 阅读次数: 0

最近想去做一个小型的五子棋对弈，中间会用到蒙特卡洛树，在此标记一下。

MCTS，即蒙特卡罗树搜索，是一类搜索算法树的统称，可以较为有效地解决一些搜索空间巨大的问题。

如一个8*8的棋盘，第一步棋有64种着法，那么第二步则有63种，依次类推，假如我们把第一步棋作为根节点，那么其子节点就有63个，再往下的子节点就有62个……

如果不加干预，树结构将会繁杂，MCTS采用策略来对获胜性较小的着法不予考虑，如第二步的63种着法中有10种是不可能胜利的，那么这十个子节点不予再次分配子节点。

MCTS的主要步骤分为四个：

1，选择（Selection）

即找一个最好的值得探索的结点，通常是先选择没有探索过的结点，如果都探索过了，再选择UCB值最大的进行选择（UCB是由一系列算法计算得到的值，这里先不详细讲，可以简单视为value）

2，扩展（Expansion）

已经选择好了需要进行扩展的结点，那么就对其进行扩展，即对其一个子节点最为下一步棋的假设，一般为随机取一个可选的节点进行扩展。

3，模拟（Simulation）

扩展出了子节点，就可以根据该子节点继续进行模拟了，我们随机选择一个可选的位置作为模拟下一步的落子，将其作为子节点，然后依据该子节点，继续寻找可选的位置作为子节点，依次类推，直到博弈已经判断出了胜负，将胜负信息作为最终得分。

4，回溯更新（Backpropagation）（此处应该也可以叫做反向传递）

将最终的得分累加到父节点，不断从下向上累加更新。

对于UCB值，计算方法很简单，公式如下：

其中，v'表示当前树节点，v表示父节点，Q表示这个树节点的累计quality值，N表示这个树节点的visit次数，C是一个常量参数。

参考：https://blog.csdn.net/qq_34470213/article/details/79490534

猜你喜欢

转载自blog.csdn.net/qq_35014850/article/details/80568007

MCTS-蒙特卡洛树搜索

蒙特卡洛树搜索（MCTS）算法

（MCTS）蒙特卡洛树搜索——参数寻优

蒙特卡洛树搜索 MCTS 入门

蒙特卡洛树搜索（MCTS）在AlphaGo Zero中

DQN、蒙特卡洛树搜索（MCTS）

面向初学者的蒙特卡洛树搜索MCTS详解及其实现

28 天自制你的 AlphaGo（五）：蒙特卡洛树搜索（MCTS）基础

强化学习（八）：Dyna架构与蒙特卡洛树搜索MCTS

MCTS蒙特卡洛树搜索（The Monte Carlo Tree Search）

蒙特卡洛树搜索

蒙特卡洛树搜索学习

如何用蒙特卡洛树搜索(MCTS)制作智能五子棋【含源码】_01

深度解析黑白棋AI代码原理（蒙特卡洛搜索树MCTS+Roxanne策略）

python使用蒙特卡洛树(MCTS)算法实现黑白棋miniAlphaGo for Reversi

蒙特卡洛树搜索——比谁想的远

蒙特卡洛搜索树实现井字棋

蒙特卡洛树搜索（新手教程）

AlphaGo制胜绝招：蒙特卡洛树搜索入门指南

蒙特卡洛树搜索算法 —— github上的implement的原代码

自动驾驶（六十一）---------蒙特卡洛搜索树

蒙特卡洛树搜索及实现三子棋游戏

基于信心上界蒙特卡洛搜索树（UCT）实现四子棋

使用PyTorch实现简单的AlphaZero的算法（2）：理解和实现蒙特卡洛树搜索

安装ribotree-利用蒙特卡洛搜索树的RNA设计工具

蒙特卡洛模拟

蒙特卡洛算法

蒙特卡洛采样

蒙特卡洛方法

蒙特卡洛 mcmc

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)