谷歌使用深度强化学习发现了更快的排序算法 - 代码天地

谷歌使用深度强化学习发现了更快的排序算法

业界资讯 2023-06-11 19:06:49 阅读次数: 0

谷歌旗下 AI 实验室 DeepMind 的工程师团队在 Nature 官网发表了一篇论文，称使用深度强化学习发现了更快的排序算法。

排序或散列等基本算法在一天内的使用量可达数万亿次，随着计算需求的增长，让这些算法尽可能高效变得至关重要。基础排序算法在过去取得了显著的进步，但如要进一步提高这些算法例程的效率，对人类科学家和已知的计算方法都具有挑战性。

而 DeepMind 通过将“寻找更好的排序程序”任务制定成一个名为 AssemblyGame 的单人游戏。在这个游戏中，玩家需要选择一系列低级 CPU 指令（汇编指令），然后将其组合起来产生一种新的高效排序算法。

然后 DeepMind 训练了一个新的深度强化学习代理 ”AlphaDev“ 来玩这个游戏，AlphaDev 的主要学习算法是 AlphaZero 代理的扩展，并使用深度神经网络指导蒙特卡洛树搜索 (MCTS) 规划过程。

（完整的训练过程和细节分析可以在 deepmind 的论文中细细阅读）

最终，AlphaDev 从零开始地发现了几项新的小型排序算法，分别可用于对大小为 3、4 和 5 的列表进行排序，且均优于已知的人类基准。

目前这些算法已经集成到 LLVM 标准 C++ 排序库中，使用强化学习的新算法替换掉了原有的 LLVM libc++ 标准排序 3、排序 4 和排序 5 算法，这些基础算法是 C++ 排序库的基本组件，通常被较大的排序算法多次调用。

值得一提的是，DeepMind 的提交是十多年来对 LLVM libc+ 排序算法子程序的首次更改。

猜你喜欢

转载自www.oschina.net/news/244274/google-finds-faste-sorting-algorithm

谷歌使用深度强化学习发现了更快的排序算法

它发现了更快的排序算法，速度快 70%

深度强化学习-DQN算法

深度强化学习——DQN算法原理

【深度强化学习】OpenAI Gym的使用

深度强化学习

强化学习算法

强化学习算法：

【深度强化学习】深度学习：Pytorch的使用

【深度强化学习】《强化学习》Monte-Carlo 算法代码实现

[强化学习实战]深度Q学习-DQN算法原理

深度学习-强化学习

【学习】深度强化学习

深度强化学习- 最全深度强化学习资料

深度强化学习-DDPG算法原理和实现

深度强化学习算法的四个问题

Github一个深度强化学习算法库

近端策略优化深度强化学习算法

深度强化学习-Dueling DQN算法原理与代码

深度强化学习-策略梯度算法深入理解

深度强化学习-策略梯度算法推导

深度强化学习-DQN算法原理与代码

深度强化学习-DDPG算法原理与代码

深度强化学习-带基线的策略梯度算法原理

深度强化学习-A3C算法

深度强化学习-TD3算法原理与代码

深度强化学习-TD3算法

深度强化学习-策略梯度算法(Reinforce)代码

深度强化学习——actor-critic算法(4)

深度强化学习-Double DQN算法原理与代码

今日推荐

周排行

【转】mongodb中删除数组内嵌对象文档

php数字金额转换成中文大写显示

枫神之路--Java 的继承机制

四、Spring中使用@Conditional按照条件注册Bean

tomcat中直接使用第3放jar包

进程的创建fork vs vfork

结构体和组合体

“无任何网络提供程序接受指定的网络路径”的解决办法

webpack配置vue项目引入和部分引入

Oracle在不同windows系统中的迁移

每日归档

更多

2024-06-14(0)

2024-06-13(0)

2024-06-12(0)

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)