《强化学习》中的第15章：神经科学

其他 2020-04-28 10:49:45 阅读次数: 0

前言：本次笔记对《强化学习（第二版）》第十五章进行概括性描述。

本次笔记内容依旧很少。神经科学是拓展部分，书上已经尽量将所举例子语言简化。

小结

大脑收益系统相关的神经通路很复杂，且没有被人类完全理解。但发展与成果是有的：

多巴胺神经活动的收益预测误差假说：一群科学家认识到了 TD 误差行为与产生多巴胺的神经元活动之间的惊人之处；
大脑实现了一个类似于“行动器-评判器”算法的东西，这是另一个重要的假说。行动器与评判器使用了不同的资格迹，且这是他们的唯一区别；
多智能体：多巴胺系统的显著特征是释放多巴胺的神经纤维可以广泛地投射到大脑的多个部分…强化学习智能体集合中的每个智能体都会收到相同的强化信号，这个信号取决于所有成员或团队的活动。如果每个团队的成员使用一个足够有效的学习算法，则即使团队成员之间没有直接交流，团队也可以集体学习，以提高整个团队的绩效，并按照全局广播的强化信号进行评估。

后话：依旧是这个问题，我现在时间比较紧张，急于将《强化学习》这本书读完；且现在没有到达能研究心理学与神经科学的高度，因此对于第14、15章采取了略读策略。个人认为这些理论固然重要，且有启发性，但其理论深度甚至已经超出了数学的范畴，即过于偏重理论。笔者会关注这些问题与新闻，希望其能为笔者的工程问题带来启发。

PiperNest (同公众号)

原创文章 163 获赞 177 访问量 4万+

关注私信

猜你喜欢

转载自blog.csdn.net/weixin_42815609/article/details/105474329

《强化学习》中的第15章：神经科学

《强化学习》中的第14章：心理学

《强化学习》中的第13章：策略梯度方法

《强化学习》中的第12章：资格迹

网络神经科学

神经科学探索脑第五章答案

神经科学探索脑第二章答案

长文解读|Progress in Neurobiology:监督式机器学习在神经科学中的应用

强化学习-强化学习的启动和运行（第1章）

机器学习第16章（强化学习）

《强化学习》中的第11章：基于函数逼近的离轨策略方法

《强化学习》中的第10章：基于函数逼近的同轨策略控制

《强化学习》中的第9章：基于函数逼近的同轨策略预测

计算神经科学 Computational Neuroscience 学习笔记

计算神经科学（二）

计算神经科学（三）

计算神经科学（一）

深度学习-20:神经科学、脑科学和稀疏特性

神经网络与强化学习

使用强化学习的神经架构搜索

Pytorch中的强化学习

强化学习中的环境

神经科学探索脑第四章课后题

神经科学探索脑第三章答案

神经科学探索脑第一章答案

神经科学探索脑第二十二章

《Scikit-Learn与TensorFlow机器学习实用指南》第16章强化学习

【翻译】Sklearn与TensorFlow机器学习实用指南 —— 第16章强化学习（下）

强化学习精要第一二章

强化学习第三四章

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)