开源免费！谷歌用于训练AI模型的强化学习框架！

强化学习 - 一种人工智能（AI）技术，使用奖励（或惩罚）来驱动代理人朝着特定目标前进 - 训练打败Alpha Go世界冠军的系统并掌握Valve的Dota 2.它是Google子公司的核心部分 DeepMind的深度Q-network（DQN），可以在多个工作人员中分配学习，例如，在Atari 2600游戏中实现“超人”性能。麻烦的是，强化学习框架需要时间来掌握一个目标，往往不太灵活的，而且不是很稳定。

开源免费！谷歌用于训练AI模型的强化学习框架上线GitHub！

这也就是谷歌提出替代方案的原因：基于TensorFlow的开源强化框架，它是一个机器学习库。目前，它已经上线Github。

开源免费！谷歌用于训练AI模型的强化学习框架上线GitHub！

“受到大脑中奖励动机行为的主要成分之一的启发，并反映了神经科学与强化学习研究之间强烈的历史联系，该平台旨在实现可以推动激进发现的那种投机性研究，”Pablo Samuel Castro和 Google Brain Team的研究人员Marc G. Bellemare在一篇博文中写道。 “这个版本还包括一组阐明如何使用我们框架的colabs。”

他们和Google Brain团队开发了强化框架，其中考虑了三个原则：灵活性，稳定性和可重复性。

为此，它包括一套精心编写的代码（15个Python文件），专注于街机学习环境 - 一个用视频游戏评估AI技术的平台 - 以及四种不同的机器学习模型：上述DQN;C51; Rainbow代理的简化版本; 和隐式分位数网络。为了重现性，代码在Arcade学习环境支持的60个游戏中提供完整的测试覆盖率和训练数据（采用JSON和Python pickle格式），并遵循标准化经验评估结果的最佳实践。

开源免费！谷歌用于训练AI模型的强化学习框架上线GitHub！

除了增强框架的发布，谷歌还推出了一个网站，允许开发人员快速可视化多个代理的培训运行。它还提供经过训练的模型，原始统计日志和TensorFlow事件文件，用于TensorBoard绘图，TensorBoard是Mountain View公司的TensorFlow程序可视化工具套件。

“我们的希望是，我们的框架的灵活性和易用性将使研究人员能够尝试新的思想，包括增量和激进，”Bellemare和Castro写道。 “我们已经积极地将它用于我们的研究，发现它使我们能够灵活地快速迭代许多想法。我们很高兴看到社区可以帮助做些更伟大的事。“

开源免费！谷歌用于训练AI模型的强化学习框架上线GitHub！

鉴于TensorFlow目前这么流行，想要学习和实践的程序员们也可以了解下谷歌最近的AI开源项目——AIY Projects。AIY 全称是 Artificial Intelligence Yourself，顾名思义就是利用 AI 来进行的 DIY 功能套件。谷歌目前为 AIY Projects 推出了两款硬件--AIY Voice Kit 和 AIY Vision Kit。其中， Vision Kit（视觉套件）附带的软件可运行三个基于TensorFlow的神经网络，可以处理图像识别和计算机视觉, 支持离线识别上千种常见物体（动物、植物）以及人脸、面部表情等。

开源免费！谷歌用于训练AI模型的强化学习框架上线GitHub！

谷歌为此还发布了一个TensorFlow.js的工具，有了这项工具，即使不是机器视觉领域的专家，大家也可以实现很多应用场景，比如在浏览器中训练自己的宠物脸辨识系统，在自家的监视系统中使用等等。

开源免费！谷歌用于训练AI模型的强化学习框架！

猜你喜欢