轻松打败世界级棋手！Facebook 开源 AI 围棋源代码

来自：开源最前线（ID：OpenSourceTop）

整编综合自：田渊栋（知乎）、https://research.fb.com/facebook-open-sources-elf-opengo/

近日，Facebook AI Research（FAIR）正式宣布开源基于 ELF 平台创建的 ELF OpenGo，这是一款 AI 机器人，它已经击败了世界冠军职业棋手。以下为博文内容：

受 DeepMind 的启发，今年早些时候，我们研究开发出了可扩展的、轻量级框架 ELF，期望达到 AlphaGoZero 最近的水平。目标是创建一个开源实现的系统，该系统可以自学围棋并能够打败职业棋手。最后，通过发布我们的代码和模型，来激励更多的人去思考这项技术新的应用和研究方向。

ELF OpenGo 已经成功打败了其他开源机器人和人类棋手。我们对 LeelaZero（基于Deepmind最新论文的围棋人工智能）进行了一系列的比赛（198 胜 2 负），2018 年 4 月 25 日），我们还击败了 4 位世界排名前 30 的围棋棋手，14 胜 0 负的记录。

我们还对 2016 年 6 月首次发布的ELF进行了改进，升级了更高效，更友好的 API 以及支持对数千台计算机进行分布式计算的框架。作为 PyTorch 的一部分，ELF 使研究人员能够轻松尝试不同的强化学习思想，并进行快速灵活的实验。

如今 ELF OpenGo 已经取得了十分不错的成绩，但田渊栋博士在知乎上发表的一篇感想文章中提到：这个项目不是为了做最好的围棋程序，不是说要打败谁。我们做这个是因为以下三个目的：

(1) AlphaGoZero/AlphaZero算法很有意思，我们想知道为什么它有效果，是怎么会有效果的，是不是如同宣传的那样是百试百灵的通用算法，是不是只要堆机器，强人工智能马上就来了？还是说其实这个算法有什么问题和弱点？DeepMind不开源也不透露细节，文章里面一些地方也没有写得很清楚。我之前写过Blog讨论过，但是没有第一手经验总不是很踏实。所以本着研究目的，我们需要复现一下，先有复现，才有创新，这个是做研究的习惯。

(2) 今年年初我重写了ELF的核心代码，另外也加了分布式训练，需要找个具体应用来测试一下。站在这个角度上，AlphaGoZero/AlphaZero是个完美的选择，再说之前也有DarkForest的代码和围棋程序的经验，所以把它们拼起来不用花太多力气。

(3) 不管是通用算法还是分布式平台，都可以用来干很多别的事情，不一定是围棋，不一定是游戏。如果我们去看ELF OpenGo的代码，会发现其实很大一部分和围棋一点关系也没有，完全适用于其它方向的工作。而围棋对我们来说，只是一个把算法和平台做好的手段。在这一点上，花点时间把围棋做好是值得的。

田渊栋博士表示，随着今天 ELF OpenGo 的发布，这三个目的都已达到。当然，他们更希望的是能够借此机会推广一下 ELF 平台和 PyTorch 深度学习框架，让更多的人使用和完善它。

代码地址：https://github.com/pytorch/ELF

轻松打败世界级棋手！Facebook 开源 AI 围棋源代码

猜你喜欢