五逻辑斯蒂回归与最大熵模型

其他 2020-09-07 15:55:58 阅读次数: 0

1 逻辑斯蒂回归模型

（1）逻辑斯蒂分布

对于连续的随机变量X，X服从逻辑斯蒂分布是指：X具有下列分布函数和密度函数：

分布函数：

密度函数：

式中：u为位置參数，r >0为形状參数。

f(x)推导过程：

（2）二项逻辑斯蒂回归模型

二项逻辑斯蒂回归模型是一种分类模型，使用P(Y|X)表示，形式为參数化的逻辑斯蒂分布。

随机变量X取值为实数，随机变量Y取值为1或0。

于是二项逻辑斯蒂回归模型就是对输入实例X，求P(Y=1|X) 和P(Y=0|X) ，然后比较其大小，将实例分为概率较大的那一类。

事件的几率(odds)： 事件的几率 = 事件发生的概率/事件不发生的概率

odds的对数几率即其logit函数就是： logit(p) = log(p / (1 - p))

于是对于逻辑斯蒂回归而言：

上式说明了：在逻辑斯蒂回归模型中，输出Y=1的对数几率是输入X的线性函数。

换句话说即：输出Y=1(输出指定类别)的对数几率是由输入X的线性函数表示的模型。

即：逻辑斯蒂回归模型就是输出Y=1(输出指定类别)的对数几率是由输入X的线性函数表示的模型。

w·x的值越接近 +∞，P(Y=1|X) 越接近1 w·x的值越接近 -∞，P(Y=1|X) 越接近0

这样的模型就是逻辑斯蒂回归模型

模型参数估计：

（3）多项逻辑斯蒂回归

2 最大熵模型

（1）最大熵原理

最大熵原理认为：在所有可能的概率模型中，熵最大的模型为最好的概率模型

对于某一个随机变量X，它的概率分布为P(X)，它的熵定义为：

熵的取值范围：

式中，|X|是X的取值个数，当且仅当X的分布是均匀分布时右边的等号成立，这就是说当X服从均匀分布时，熵最大。

（2）最大熵模型的定义

我们的目的：利用最大熵原理，选择一个最好的分类模型；从而，对于任何给定的样本x∈X，都可以以概率P(y|x)输出y∈Y。

例如两分类问题：得到的分类器P(Y|X)，可以使得对于任何给定的样本x∈X，都可以计算得到P(y=1|x)和P(y=0|x)

具体构造思路为：

image_1b3h7kjju4e21p6nqdilbh1ed19.png-41.4kB

6.13的公式推导：条件熵H(X|Y) = H(X,Y) - H(Y)

3 最大熵模型的学习

最大熵模型的学习过程就是求解最大熵模型的过程，最大熵模型的学习等价于约束最优化问题：

image_1b3h8fqlg8h684f86n1rqn1aj92a.png-20.3kB

这个优化问题可以转换为最小化问题：

image_1b3h8hr9ktjv1o1ejmb16n61jne2n.png-21.1kB

求解约束最优化问题：

构建拉格朗日函数：

image_1b3h8vfqm15dc1kpgjhr1ubj1vas3h.png-14.8kB

即：

image_1b3h911s715mv7qb7dsdr4b963u.png-26.8kB

从而，得到原始问题的等价形式：

image_1b3h91mqofmi10ho16u5dn61r0s4b.png-4.5kB

继而，得到原始问题的对偶问题：

image_1b3h92mqtcecov51nk718rs1ane4o.png-4.4kB

由于这里的Lagrange函数是凸函数，所以原问题和对偶问题的最优解相同，接下来只需要求解对偶问题的最优解就可以：

先求内部的最小化问题：

目标函数对p(y|x)求梯度：

image_1b3h9cfjl10s4ffkn08pm1v0055.png-29.5kB

并令梯度为0，可以求得最优的p(y|x)。它是w的函数

image_1b3ha3ppcsg91qav19kukk6hra5v.png-9.6kB

将该最优解代回到对偶问题，再求最外的关于ww的最大化问题：

image_1b3ha58s2137igs61jir17tc8or6c.png-3kB

求解得到最优的w∗：

image_1b3ha5p2f1q2onnn160dh13iad6p.png-4.8kB

最后，Pw∗可求，也就是最优的：

image_1b3ha7caa2kgbts1rdfjm11nih76.png-4.2kB

猜你喜欢

转载自blog.csdn.net/zstu_lihang/article/details/93655749

五逻辑斯蒂回归与最大熵模型

《统计学习方法》笔记（五）逻辑斯蒂回归与最大熵模型

细讲逻辑斯蒂回归与朴素贝叶斯、最大熵原理的爱恨交织（五）

逻辑斯蒂回归与最大熵模型

第6章逻辑斯蒂回归与最大熵模型

LR(逻辑斯蒂回归)和最大熵模型

统计学习方法：逻辑斯蒂回归与最大熵模型 (六)

《统计学习方法（李航）》逻辑斯蒂回归与最大熵模型学习笔记

《统计学习方法》——第6章逻辑斯蒂回归与最大熵模型

第六章逻辑斯蒂回归与最大熵模型

统计学习方法——逻辑斯蒂回归与最大熵模型

《统计学习方法》——逻辑斯蒂回归和最大熵模型

逻辑斯谛回归与最大熵模型

逻辑斯蒂回归模型

统计学习方法ｃ++实现之五逻辑斯蒂回归

统计学习方法c++实现之五逻辑斯蒂回归

《统计学习方法》第六章: 逻辑斯蒂回归与最大熵模型读书笔记

统计学习方法读书笔记（六）-逻辑斯蒂回归与最大熵模型（迭代尺度法（IIS））

逻辑斯谛回归，softmax回归与最大熵模型

各种机器学习的应用场景分别是什么？例如，k近邻,贝叶斯，决策树，svm，逻辑斯蒂回归和最大熵模型...

李航·统计学习方法笔记·第6章 logistic regression与最大熵模型（1）·逻辑斯蒂回归模型

逻辑回归与最大熵模型

细讲逻辑斯蒂回归与朴素贝叶斯、最大熵原理的爱恨交织（长文）

细讲逻辑斯蒂回归与朴素贝叶斯、最大熵原理的爱恨交织（六）

细讲逻辑斯蒂回归与朴素贝叶斯、最大熵原理的爱恨交织（四）

细讲逻辑斯蒂回归与朴素贝叶斯、最大熵原理的爱恨交织（三）

细讲逻辑斯蒂回归与朴素贝叶斯、最大熵原理的爱恨交织（一）

细讲逻辑斯蒂回归与朴素贝叶斯、最大熵原理的爱恨交织（二）

逻辑斯蒂回归

逻辑斯蒂和最大熵-李航

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)