小 P 周刊 Vol.06

小 P 为你送上本周值得一看的信息~

有意见、建议与吐槽,欢迎直接给小 P 留言哦~

点击段落标题即可打开对应网页。

学术前沿

CMU: 基于模型的强化学习的实验设计观点

本篇文章介绍了卡耐基梅隆大学的机器学习团队在 ICLR 发表的论文《基于模型的强化学习的实验设计观点》("An Experimental Design Perspective on Model-Based Reinforcement Learning")

与传统的机器学习不同,在强化学习中,智能体 (Agent) 可以选择数据来学习,如果有明智的选择策略,那么较少的数据量也可以在一项任务中有良好的表现。

针对“如果我们要从 state-action 空间中的任何一个地方收集一个额外的数据点,以最好地改善我们对任务的解决方案,那我们要收集哪个数据点”这个问题,这篇论文提供了一个答案——作者团队推导出了一个采集函数 (Acquisition function),指导智能体选择数据,进行最成功的学习。

技术基础

梯度下降法为什么能够奏效?

在机器学习中,梯度下降法是最为基础且常用的方法之一,但并不是所有人都清楚为什么梯度下降法可以奏效。

在本篇文章中,作者使用微分方程进行推导,向读者清晰地介绍了梯度下降法的原理。如果你也对这个概念抱有疑惑,不妨阅读一下。

Effective Modern C++ 民间中文版

Scott Meyers 的经典之作 Effective Modern C++ 的中文版终于由 CnTransGroup 翻译完成。作为 C++11/14 的宝书之一,本书无疑值得 C++ 程序员深入阅读。

该翻译版本目前托管在 GitHub 上。

设计哲学

凯文凯利在 70 岁生日时写的 103 条人生忠告

互联网圈的著名大佬凯文凯利在他的 70 岁生日写下了对年轻人的 103 条人生忠告(他在 68、69 岁生日时也写过)。本文作者将这些箴言译成了中文,或许也能带给你一些启发。

小 P 特别奖

程序员延寿指南

从生活各方面引用文献,分析程序员如何稳健地活得更久。


感谢阅读,欢迎在评论区留言讨论哦~

P.S. 如果喜欢本篇文章,请多多 点赞,让更多的人看见我们 :D

关注 公众号「SenseParrots」,获取人工智能框架前沿业界动态与技术思考。

{{o.name}}
{{m.name}}

猜你喜欢

转载自my.oschina.net/u/5682856/blog/5526072