【机器学习基础】交叉熵（cross entropy）损失函数是凸函数吗？ - 代码天地

【机器学习基础】交叉熵（cross entropy）损失函数是凸函数吗？

企业开发 2019-12-01 21:33:57 阅读次数: 0

之所以会有这个问题，是因为在学习 logistic regression 时，《统计机器学习》一书说它的负对数似然函数是凸函数，而 logistic regression 的负对数似然函数（negative log likelihood）和交叉熵函数（cross entropy）具有一样的形式。

先给出结论，logistic regression 时，cross entropy 是凸的，但多层神经网络时，cross entropy 不是凸的。

logistic regression 时，cross entropy 是凸的：

Why is the error function minimized in logistic regression convex? -- Deepak Roy Chittajallu

多层神经网络（MLP）时，cross entropy 不是凸的：

Cost function of neural network is non-convex? - Cross Validated

cross entropy 损失函数：(\(\hat{y}\) 为预测值，\(y\) 为真实值)

\[-y \log \hat{y}-(1-y) \log (1-\hat{y})\]

直观解释

简单点的解释是，logistic regression 时，证明两个凸函数相加还是凸函数，因为 \(y\) 不是 0 就是 1，那就要证明此时 \(- \log \hat{y}\) 和 \(- \log (1-\hat{y})\) 关于 \(w\) 都是凸函数，也就是证明 Hessian 矩阵半正定。证明看上述链接。

而 MLP 时，给出直观解释是，在神经网络的某一隐藏层交换两个神经元的权重，最后输出层得到的值不会变，这就说明如果有一个最优解，那交换神经元权重后，解仍然是最优的，那么此时就存在两个最优解了，那就不是凸函数了。

logistic regression 为什么还用梯度下降法求解呢，不直接求解析解？

在令 cross entropy 一阶导数为 0 时，就会发现无法将权重 \(w\) 提到等式左边，即无法写成 \(w = 式子\) 这种形式，所以虽然有等式约束，但直接求解析解还是挺困难。所以梯度下降法、牛顿法、拟牛顿法常用来求解 logistic regression。

References

Why is the error function minimized in logistic regression convex? -- Deepak Roy Chittajallu
Cost function of neural network is non-convex? - Cross Validated
Logistic回归能有解析解吗？ - Zzzzzzzz的回答 - 知乎

猜你喜欢

转载自www.cnblogs.com/wuliytTaotao/p/11967620.html

【机器学习基础】交叉熵（cross entropy）损失函数是凸函数吗？

【机器学习】交叉熵损失函数（Cross-Entropy Loss）

机器学习基础（六）—— 交叉熵代价函数（cross-entropy error）

机器学习什么是Cross Entropy 交叉熵

损失函数——交叉熵损失（Cross-entropy loss）

【损失函数】Cross Entropy Loss 交叉熵损失

关于交叉熵损失函数Cross Entropy Loss

学习笔记8：常用损失函数之交叉熵（Cross Entropy）

深度学习---交叉熵损失函数（cross-entropy cost function）

叉熵损失函数(Cross Entropy)

叉熵损失函数(Cross Entropy)

cross-entropy交叉熵代价函数

信息量 Amount of Information、熵 Entropy、交叉熵 Cross Entropy、KL散度 KL Divergence、交叉熵损失函数 Cross Entropy Loss

机器学习 [交叉熵损失函数]

二项分布的对数似然函数与交叉熵（cross entropy）损失函数的联系

从熵、相对熵、交叉熵到机器学习的交叉熵损失与softmax损失函数

交叉熵和均方差损失函数的比较（Cross-Entropy vs. Squared Error）

caffe 加权交叉熵损失函数层（weighted sigmoid_cross_entropy_loss_layer）添加方法

torch的交叉熵损失函数(cross_entropy)计算(含python代码)

Cross Entropy 交叉熵

交叉熵损失(Cross Entropy)求导

损失函数(交叉熵损失cross-entropy、对数似然损失、多分类SVM损失(合页损失hinge loss))、Softmax分类器和交叉熵损失cross-entropy

【机器学习】 - 关于合适用均方误差（MSE）何时用交叉熵（cross-entropy）

机器学习中的损失函数（凸函数辨别）

交叉熵代价函数（cross-entropy cost function）

详解机器学习损失函数之交叉熵

详细剖析机器学习中的损失函数---交叉熵

【机器学习入门】交叉熵损失函数与MLE准则

MATLAB算法实战应用案例精讲-【数模应用】交叉熵损失函数（Cross-entropy loss function）（补充篇）

MATLAB算法实战应用案例精讲-【数模应用】交叉熵损失函数（Cross-entropy loss function）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)