轻松打败世界级棋手!Facebook 开源 AI 围棋源代码

来自:开源最前线(ID:OpenSourceTop)

整编综合自:田渊栋(知乎)、https://research.fb.com/facebook-open-sources-elf-opengo/


近日,Facebook AI Research(FAIR)正式宣布开源基于 ELF 平台创建的 ELF OpenGo,这是一款 AI 机器人,它已经击败了世界冠军职业棋手。以下为博文内容:


轻松打败世界级棋手!Facebook 开源 AI 围棋源代码


受 DeepMind 的启发,今年早些时候,我们研究开发出了可扩展的、轻量级框架 ELF,期望达到 AlphaGoZero 最近的水平。目标是创建一个开源实现的系统,该系统可以自学围棋并能够打败职业棋手。最后,通过发布我们的代码和模型,来激励更多的人去思考这项技术新的应用和研究方向。

ELF OpenGo 已经成功打败了其他开源机器人和人类棋手。我们对 LeelaZero(基于Deepmind最新论文的围棋人工智能)进行了一系列的比赛(198 胜 2 负),2018 年 4 月 25 日),我们还击败了 4 位世界排名前 30 的围棋棋手,14 胜 0 负的记录。


轻松打败世界级棋手!Facebook 开源 AI 围棋源代码


我们还对 2016 年 6 月首次发布的ELF进行了改进,升级了更高效,更友好的 API 以及支持对数千台计算机进行分布式计算的框架。作为 PyTorch 的一部分,ELF 使研究人员能够轻松尝试不同的强化学习思想,并进行快速灵活的实验。

如今 ELF OpenGo 已经取得了十分不错的成绩,但田渊栋博士在知乎上发表的一篇感想文章中提到:这个项目不是为了做最好的围棋程序,不是说要打败谁。我们做这个是因为以下三个目的:

(1) AlphaGoZero/AlphaZero算法很有意思,我们想知道为什么它有效果,是怎么会有效果的,是不是如同宣传的那样是百试百灵的通用算法,是不是只要堆机器,强人工智能马上就来了?还是说其实这个算法有什么问题和弱点?DeepMind不开源也不透露细节,文章里面一些地方也没有写得很清楚。我之前写过Blog讨论过,但是没有第一手经验总不是很踏实。所以本着研究目的,我们需要复现一下,先有复现,才有创新,这个是做研究的习惯。

(2) 今年年初我重写了ELF的核心代码,另外也加了分布式训练,需要找个具体应用来测试一下。站在这个角度上,AlphaGoZero/AlphaZero是个完美的选择,再说之前也有DarkForest的代码和围棋程序的经验,所以把它们拼起来不用花太多力气。

(3) 不管是通用算法还是分布式平台,都可以用来干很多别的事情,不一定是围棋,不一定是游戏。如果我们去看ELF OpenGo的代码,会发现其实很大一部分和围棋一点关系也没有,完全适用于其它方向的工作。而围棋对我们来说,只是一个把算法和平台做好的手段。在这一点上,花点时间把围棋做好是值得的。

田渊栋博士表示,随着今天 ELF OpenGo 的发布,这三个目的都已达到。当然,他们更希望的是能够借此机会推广一下 ELF 平台和 PyTorch 深度学习框架,让更多的人使用和完善它。

代码地址:https://github.com/pytorch/ELF

猜你喜欢

转载自blog.csdn.net/weixin_34190136/article/details/86753272