蒙特卡洛搜索树实现井字棋

蒙特卡洛算法在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

例子

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

井字棋实现

1)以当前局面创建根节点
2)棋面剩余位置为子节点
3)因每个子节点访问为0,所以循环模拟每个子节点,然后反向传播,下一步在从根节点根据UCB进行选择,扩展,模拟,反向传播,直到训练结束
4)从当前棋面下用UCB选择下一步棋面进行落子
5)然后重复step1,step2,step3,step4直到游戏结束

猜你喜欢

转载自blog.csdn.net/weixin_45735242/article/details/105466382