深度强化学习算法是否需要使用批归一化(Batch Norm) 或归一化，文本带你详解。

企业开发 2023-07-15 15:48:50 阅读次数: 0

深度强化学习算法 (DRL, Deep Reinforcement Learning Algorithm) 的神经网络是否需要使用批归一化 (BN, Batch Normalization) 或归一化（白化 whitening）？

深度强化学习不需要批归一化，但是可以用归一化。（长话短说）

归一化指的是深度学习的白化（whitening），这种操作可以让神经网络舒服地训练。本文讨论了 state action 这些输入值以及 Q 值（reward）这些输出值的归一化问题。见下方目录。

舒服地训练：让神经网络的输入值，或者输出值尽可能靠近正态分布，从而让激活函数正常工作，随机初始化的参数不需要被夸张地调整，梯度下降优化器的超参数可以不调。

代码与对应的流程，如下：

ElegantRL 的网络基类，Critic 网络，直接把归一化的均值和方差这些参数记录在神经网络里，即插即用

猜你喜欢

转载自blog.csdn.net/sinat_39620217/article/details/131727365

深度强化学习算法是否需要使用批归一化(Batch Norm) 或归一化，文本带你详解。

标准化归一化 batch norm, layer norm, group norm, instance norm

Group Norm（GN 组归一化）笔记

深度学习基础--正则化与norm--L2归一化

Batch Norm/Layer Norm/Instance Norm /Group Norm/Switchable Norm

Group Norm，Batch Norm，Layer Norm

深度学习基础--正则化与norm--局部响应归一化层(Local Response Normalization, LRN)

batch norm, layer norm, instance norm, group norm

norm归一化处理——按照行进行？？？

L2-norm 归一化有啥用？最简单的一个范数

深度学习正则化(L1 norm/L2 norm)以及dropout理解

深度学习笔记（二）：3.1Batch Norm原理详解

深度学习基础--正则化与norm--L2归一化、L2正则化、L2范数的区别

【深度学习】批归一化（Batch Normalization）

详解OpenCV的矩阵规范化函数normalize()【范围化矩阵的范数或值范围(归一化处理)】,并附NORM_MINMAX情况下的示例代码

深度学习基础--正则化与norm--正则化(Regularization)

深度学习基础--正则化与norm--正则化技术

深度学习基础--正则化与norm--instance normalization

深度学习基础--正则化与norm--Weight Normalization

深度学习基础--正则化与norm--Switchable Normalization

深度学习-norm

2.3.2 Batch Norm介绍

batch-norm

关于batch norm

5.10_batch-norm

深度学习基础--正则化与norm--Batch Normalization，简称BN

深度学习的基础知识(RNN、LSTM等模型、激励函数、正则化、norm batch)

【深度学习框架-torch】torch.norm函数详解用法

Keras深度学习实战（5）——批归一化详解

norm

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)