sklearn中逻辑回归（logistic regression）的损失函数推导 - 代码天地

sklearn中逻辑回归（logistic regression）的损失函数推导

其他 2019-04-13 03:28:39 阅读次数: 0

最近无意阅读sklearn中关于logistic regression的文档时，发现其损失函数和意识中长的不一样，有必要简单梳理下。

绝大部分的文章或者资料都习惯于将label y的空间定义为0和1，因此我们使用极大似然估计（maximum likelihood estimate）可以很轻松写出其似然函数：

$\leqno(1)\qquad L(\theta )= \sum ylog(h(\theta ))+(1-y)log(1-h(\theta ))$

加上L2正则项后，整理可得我们需要最小化的损失函数如下：

$\leqno(2)\qquad Loss(\theta)= \sum_{i=0}^{m}-y_i\theta x_i-ln(1-h_\theta(x_i)) + C\theta^T\theta$

sklearn中假设y正负label定义为1和-1，因此其损失函数也和上面形式不太一样，sklearn关于logistic regression的损失函数为：

$\leqno(3)\qquad \min_{w, c} \|w\|_1 + C \sum_{i=1}^n \log(\exp(- y_i (X_i^T w + c)) + 1).$

前面第一项为正则项，我们集中看一下后一项的推导，首先logistic function：

$h(x)=\frac{1}{1+e^{-x}}$

显然y属于(1,-1)后，对于单个样本，其概率可统一为 $h(\theta^Tx_iy_i)$ :

$P(y_i=1|x_i,\theta ) = h_\theta (x_i,\theta)=\frac{1}{1+e^{-\theta^Tx_iy_i}}$

$P(y_i=-1|x_i,\theta ) = 1-h_\theta (x_i,\theta)=\frac{1}{1+e^{-\theta^Tx_iy_i}}$

即最大化似然概率为：

$\max_{\theta} \Pi _{i=1}^mh(\theta^Tx_iy_i)\\=\max_{\theta} \sum _{i=1}^mlog(h(\theta^Tx_iy_i))\\ =\min_{\theta} \sum _{i=1}^m-log(h(\theta^Tx_iy_i))\\ =\min_{\theta} \sum _{i=1}^m-log(\frac{1}{1+e^{-\theta^Tx_iy_i}})\\ =\min_{\theta} \sum _{i=1}^mlog(1+e^{-\theta^Tx_iy_i})\\ =\min_{\theta} \sum _{i=1}^mlog(exp({-\theta^Tx_iy_i})+1)\\$

看上去已经和(3)给出的损失函数很接近了，式(3)中c应该为偏置项目，但是无关大雅。我们再看下一下sklearn中计算损失的代码，损失out包含两个部分，同理0.5 * alpha * np.dot(w,w)显然是L2的正则化：

    # Logistic loss is the negative of the log of the logistic function.
    out = -np.sum(sample_weight * log_logistic(yz)) + .5 * alpha * np.dot(w, w)

yz等于 $\theta^Tx_iy_i$ ，可见符合上述推导的公式。

猜你喜欢

转载自blog.csdn.net/wh_springer/article/details/89236868

sklearn中逻辑回归（logistic regression）的损失函数推导

逻辑斯蒂回归（Logistic Regression，LR）及其损失函数（包含凸性推导）

逻辑回归(logistic regression)推导

逻辑回归（Logistic Regression）推导

Logistic Regression逻辑回归的损失函数与梯度下降训练

超详细 Sklearn中逻辑回归的参数说明（Logistic Regression）

逻辑回归损失函数推导

sklearn逻辑回归(Logistic Regression,LR)调参指南

Logistic Regression（逻辑回归）原理及公式推导

Logistic Regression逻辑回归原理及推导

Logistic Regression——逻辑回归算法推导

逻辑回归（Logistic Regression）入门理解与推导

逻辑回归（Logistic Regression）原理及推导

逻辑回归 Logistic Regression

逻辑回归（Logistic Regression）

Logistic Regression 逻辑回归

逻辑回归 — Logistic Regression

逻辑回归Logistic Regression

逻辑回归(Logistic Regression)

Logistic Regression（逻辑回归）

Logistic Regression(逻辑回归)

逻辑回归-Logistic Regression

逻辑回归（ Logistic regression）

通俗地说逻辑回归【Logistic regression】算法（二）sklearn逻辑回归实战

逻辑回归损失函数推导及求导

【Logistic Regression（逻辑回归）】极大似然函数、梯度下降推导！

线性回归损失函数的推导

【ML_Algorithm 2 】逻辑回归(Logistic Regression)——算法推导

逻辑回归(Logistic Regression)详解,公式推导及代码实现

逻辑回归（Logistic Regression）模型

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)