从MAP角度理解神经网络训练过程中的正则化 - 代码天地

从MAP角度理解神经网络训练过程中的正则化

其他 2019-06-27 23:04:54 阅读次数: 0

在前面的文章中,已经介绍了从有约束条件下的凸优化角度思考神经网络训练过程中的L2正则化,本次我们从最大后验概率点估计(MAP,maximum a posteriori point estimate)的角度来理解神经网络中十分重要的weight decay正则化方法.

前面的文章中讲到了梯度下降法可以从最大似然概率估计(ML)的角度来理解,最大似然是一种典型的频率统计方法,还有一种非常不同的贝叶斯统计方法(具体的区别请参考花书).由于贝叶斯统计方法很多时候是复杂不易于处理的,因此我们更想要一种类似与ML的点估计方法.而MAP正是一种点估计的近似贝叶斯估计方法.MAP选择使得后验概率最大的点作为最优估计,定义如下:\[ \boldsymbol{\theta}_{MAP} = \underset{\boldsymbol{\theta}}{argmax}p(\boldsymbol{\theta}|x) = \underset{\boldsymbol{\theta}}{argmax}log(x|\boldsymbol{\theta})+logp(\boldsymbol{\theta})\]
上式右边\(log(x|\boldsymbol{\theta})\)项正是对数最大似然部分,而\(logp(\boldsymbol{\theta})\)项是先验概率部分.

相较于最大似然估计,MAP多了先验概率部分,而这部分是无法从训练样本中得到的,利用先验概率部分可以起到减小泛化误差的作用.

例如,将先验概率设为权重\(\boldsymbol{w}\)符合均值为0,方差为\(\frac{1}{\lambda}I^{2}\)的高斯分布,则上式中的先验概率项,就可化为形如\(\lambda w^{T}w\)的L2正则化项.
MAP方法提供了一种设计复杂的可解释的正则化方法的直接途径.

猜你喜欢

转载自www.cnblogs.com/hello-ai/p/11100091.html

从MAP角度理解神经网络训练过程中的正则化

神经网络训练过程中tips

神经网络训练过程中不收敛或者训练失败の原因

神经网络训练过程中不收敛或者训练失败的原因

[解决]神经网络训练过程中loss中出现Non

尝试理解神经网络训练过程

神经网络训练过程概述

神经网络训练中batch的作用（从更高角度理解）

用TensorBoard可视化tensorflow神经网络模型结构与训练过程的方法

卷积神经网络（CNN）的训练过程

神经网络训练过程loss注意事项

神经网络训练算法的调用,神经网络训练过程图解

训练图像识别神经网络,神经网络训练过程图解

AI应用开发基础傻瓜书系列4-用线性回归来理解神经网络的训练过程

小白都理解的人工智能系列（13）——如何加速神经网络训练过程

Tensorflow搭建第一个RNN——LSTM神经网络（回归）、训练过程的matplotlib可视化

人工智能撸代码,怎样可视化神经网络算法实现模型的训练过程

关于深度卷积神经网络训练过程中一开始准确率就是1的问题

训练神经网络的过程中主要概念-学习笔记

从零开始机器学习-17 神经网络的训练过程

TensorFlow游乐园介绍及其神经网络训练过程

一点神经网络训练过程的小总结

使用tensorflow下的GPU加速神经网络训练过程

手算梯度下降法，详解神经网络迭代训练过程

以一个简单的RNN为例梳理神经网络的训练过程

Keras深度学习实战（1）——神经网络基础与模型训练过程详解

使用tensorflow搭建分类神经网络以及迁移学习（训练过程）

基于SNN脉冲神经网络的Hebbian学习训练过程matlab仿真

PyTorch深度学习实战（1）——神经网络与模型训练过程详解

【深入了解PyTorch】神经网络与模型训练过程详解

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)