机器学习-熵和优化方法

其他 2020-10-26 01:15:07 阅读次数: 0

熵

信息熵公式

$H(X)=-\sum_{x}P(x)logP(x)$

条件熵

$H(X|Y)=-\sum_{x,y}P(x,y)logP(x|y)$

联合熵

$H(X,Y)=-\sum_{x,y}P(x,y)logP(x,y)$

互信息

$I(X,Y)=H(X)-H(X|Y)=-\sum_{x,y}P(x,y)\frac{P(x,y)}{P(x)P(y)}$

交叉熵

$H(p,q)=-\sum_{x}P(x)logQ(x)$

相对熵(K-L散度)

$D_{kl}(p,q)=-\sum_{x}P(x)\frac{P(x)}{Q(x)}=-(H_{p(x)}-H(p,q))$

优化方法

梯度下降算法

梯度下降算法batch大小的影响

batch大 : 全局最优解、易于并行｜训练样本多的时候，训练很慢
batch小 : 训练速度快、准确率略有下降｜局部最优、训练震荡

SGD于GD的比较:sgd能更有效的利用信息、特别是信息比较冗余的时候，SGD前期迭代效果显著，当数据量很大时候，SGD在计算复杂度上更有优势。

牛顿法

求解 $f (x) = 0$

$x_{n+1}=x_{n+1}-\frac{f(x_n)}{f(x_n)'}$

所以为了求解 $f (x)$ 的极值,也即求 $f (x)^{'} = 0$

$x_{n+1}=x_{n+1}-\frac{f(x_n)'}{f(x_n)''}$

对于多元的情况

$x_{n+1}=x_{n+1}-(\nabla^2f(x_n))^{-1}{f(x_n)'}= x_n-H^{-1}g$
$H$ 为Hession矩阵, $g$ 为梯度

问题

Hession可能不可逆
求逆计算复杂度高
可能不会收敛到一个最优解(甚至不能保证收敛)

##拟牛顿法

不计算Hession矩阵的逆，用其他方法得到逆的近似

改进的迭代尺度法

猜你喜欢

转载自blog.csdn.net/lovoslbdy/article/details/104860379

机器学习-熵和优化方法

详解机器学习中的熵、条件熵、相对熵和交叉熵

【转】详解机器学习中的熵、条件熵、相对熵和交叉熵

机器学习中的熵、条件熵、相对熵和交叉熵

机器学习笔记-信息熵、条件熵、相对熵、交叉熵和互信息

机器学习中的熵和 loss function

最大熵和EM算法（机器学习）

机器学习采样方法 / 机器学习中的熵

机器学习 | 优化方法

熵(Entropy):机器学习

机器学习之熵

机器学习常用的熵

机器学习信息熵

机器学习——信息熵

深度学习和机器学习最优化方法总结

[Python嗯~机器学习]---对熵、条件熵、相对熵的补充

2.20机器学习：交叉熵信息熵相对熵

机器学习之常用损失函数和优化方法

机器学习——最大熵模型

机器学习之相对熵

机器学习-交叉熵原理

机器学习 - 最大熵模型

机器学习中的熵的理解

机器学习--最大熵模型

机器学习中的交叉熵

机器学习：最大熵模型

机器学习、深度学习中的信息熵、相对熵（KL散度）、交叉熵、条件熵

凸优化和机器学习

《强化学习》基本概念和交叉熵方法

从熵、相对熵、交叉熵到机器学习的交叉熵损失与softmax损失函数

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)