机器学习——优化算法（一）

企业开发 2023-06-18 19:20:56 阅读次数: 0

活动地址：CSDN21天学习挑战赛

资料来源：deeplearing.ai
《机器学习实战》，机械工业出版社

机器学习——优化算法（一）

一.mini-batch梯度下降法

训练集输入： $X_{(n_x,m)}=[x^{(1)},x^{(2)},x^{(3)},...,x^{(m)}]$
训练集输出： $Y_{(1,m)}=[y^{(1)},y^{(2)},y^{(3)},...,y^{(m)}]$
$n_x:自变量个数 \\m:输入集中样本数目\\x^{(i)}:第i个样本的输入\\y^{(i)}:第i个样本的输出$
如果样本的数目过大，即使我们使用向量化的方法也会导致训练时间较长，因为我们每进行一次梯度下降法就必须对整个训练集的数据进行处理，直到整个训练集被处理完才能进行下一步操作。因此我们可以把训练集分割为一个个小的子集，每次处理一个子集，基于单个子集进行梯度计算，显然这可以明显提高算法速度。
例如，我们假定m=5000000，我们可以将整个训练集输入分成5000个子集，每个子集包含1000个样本，如下所示：
$X^{\{1\}}=[x^{(1)},x^{(2)},...,x^{(1000)}]\\X^{\{2\}}=[x^{(1001)},x^{(1002)},...,x^{(2000)}]\\...\\X^{\{5000\}}=[x^{(4999001)},x^{(4999001)},...,x^{(5000000)}]$
同理我们将输出也分为5000个子集，记作： $Y^{\{1\}},Y^{\{2\}},...Y^{\{5000\}}$
伪代码如下所示：

$for\space t=1:5000\\ \%向前传播\\Z^{[1]}=W^{[1]}X^{\{t\}}+b^{[1]}\\A^{[1]}=g^{[1]}(Z^{[1]})\\Z^{[2]}=W^{[2]}X^{\{t\}}+b^{[2]}\\A^{[1]}=g^{[2]}(Z^{[2]})\\...\\Z^{[L]}=W^{[L]}X^{\{t\}}+b^{[L]}\\A^{[L]}=g^{[L]}(Z^{[L]})$
$\%计算代价函数\\J^{\{t\}}=\frac{1}{1000}\sum_{i=1}^Ll(\hat{y^i},y^i)+\frac{\lambda}{2*1000}\sum_{l=1}^L||W^{[l]}||^2_F\%L2正则化可以防止过拟合$
$\%l(x,y)为逻辑回归成本函数;\\\%||W^{[l]}||^2_F=\sum_{i=1}^{n[l-1]}\sum_{j=1}^{n[l]}(W_{ij}^{[l]})^2,即l层权重矩阵的所有元素平方和；\\\%l为当前神经网络层数；\\\%通过代价函数计算梯度，进行反向传播；$
$W^{[l]}=W^{[l]}-\alpha dW^{[l]},b^{[l]}=b^{[l]}-\alpha db^{[l]}$

注意，当每个子集中样本数为一时，就变成了随机梯度下降。

猜你喜欢

转载自blog.csdn.net/sunshineking9/article/details/126079562

机器学习——优化算法（一）

机器学习（优化算法一）——梯度下降

机器学习之算法优化（一）

机器学习优化算法

机器学习的优化算法

机器学习中优化算法

机器学习中的优化算法

机器学习算法 | 凸优化

机器学习——一些常用的最优化算法

机器学习：一文详解算法优化内部机制

【深度学习】机器学习概述（一）机器学习三要素——模型、学习准则、优化算法

机器学习算法一

机器学习&深度学习优化算法

深度学习（机器学习）优化算法

机器学习最常用优化之一——梯度下降优化算法综述

机器学习理论之算法优化

机器学习优化算法之梯度下降

机器学习之优化算法总结

机器学习常见的优化算法

机器学习中的最优化算法总结

机器学习中常见的优化算法

机器学习中的优化算法（附代码）

机器学习超参数优化算法-Hyperband

机器学习各类优化算法总结

机器学习中的最优化算法（1）

【机器学习】四、算法优化——正则化

机器学习之算法优化（二）

机器学习中の优化算法

机器学习动量优化算法笔记

梯度下降法-优化算法-机器学习

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)