最大熵模型（MaxEnt）：万法归宗（上） - 代码天地

最大熵模型（MaxEnt）：万法归宗（上）

其他 2018-09-12 10:49:18 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/baimafujinji/article/details/78992878

在上一篇文章【1】中，我们已经得到了与最大熵模型之学习等价的带约束的最优化问题：

注意上述公式中还隐含一个不等式约束即 P(y|x)≥0。求解这个带约束的最优化问题，所得之解即为最大熵模型学习的解。本文就来完成这个推导。

现在这里需要使用拉格朗日乘数法，并将带约束的最优化之原始问题转换为无约束的最优化之对偶问题，并通过求解对偶问题来求解原始问题。首先，引入拉格朗日乘子，并定义拉格朗日函数L(P, w)：

According to [7], to find the solution to the optimization problem, we appealed to the Kuhn-Tucker theorem, which states that we can (1) first solve L(P, w) for P to get a parametric form for P* in terms of w; (2) then plug P* back in to L(P, w), this time solving for w*.

原始问题与对偶问题

最优化的原始问题是

通过交换极大和极小的位置，可以得到如下这个对偶问题

由于拉格朗日函数L(P,w)是P的凸函数，原始问题与对偶问题的解是等价的。这样便可以通过求解对偶问题来求解原始问题。

对偶问题内层的极小问题是关于参数w的函数，将其记为

同时将其解记为

接下来，根据费马定理，求L(P,w)对P(y|x)的偏导数

注意上述推导中运用了下面这个事实

进一步地，令

又因为，于是有

进而有

又因为

所以可得

即

将上面的式子带回前面P(y|x)的表达式，则得到

其中，

Z_w(x)称为规范化因子； f _i(x,y)是特征函数；w_i是特征的权值。由上述两式所表示的模型P_w=P_w(y|x)就是最大熵模型。这里，w是最大熵模型中的参数向量。注意到，我们之前曾经提过，特征函数可以是任意实值函数，如果f_i(x,y)=x_i，那么这其实也就是【5】中所说的多元逻辑回归模型，即

此亦是万法归宗的第一层境界。关于上面这个式子的一个简单例子，你还可参考文献【6】。

极大似然估计

下面，需要求解对偶问题中外部的极大化问题

将其解记为w*，即

这就是说，可以应用最优化算法求对偶函数的极大化，得到w*，用来表示。这里，是学习到的最优模型（最大熵模型）。于是，最大熵模型的学习算法现在就归结为对偶函数的极大化问题上来。

前面我们已经给出了的表达式：

由于，其中

于是将P_w(y|x)带入，可得

注意其中倒数第4行至倒数第3行运用了下面这个推导：

下面我们来证明对偶函数的极大化等价于最大熵模型的极大似然估计。已知训练数据的经验概率分布，条件概率分布P(Y|X)的对数似然函数表示为

当条件概率分布P(y|x)是最大熵模型时时，对数似然函数为

对比之后，不难发现

既然对偶函数等价于对数似然函数，于是也就证明了最大熵模型学习中的对偶函数极大化等价于最大熵模型的极大似然估计这一事实。此亦是万法归宗的第二层境界。由此，最大熵模型的学习问题就转换为具体求解“对数似然函数极大化的问题”或者“对偶函数极大化的问题”。

参考文献与推荐阅读材料

【1】最大熵模型（MaxEnt）：万法归宗（上）

【2】李航，统计学习方法，清华大学出版社

【3】https://www.cnblogs.com/wxquare/p/5858008.html

【4】http://blog.csdn.net/itplus/article/details/26550273

【5】http://blog.csdn.net/baimafujinji/article/details/51703322

【6】https://www.youtube.com/watch?v=hSXFuypLukA&list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49&index=10

【7】http://www.cs.cmu.edu/afs/cs/user/aberger/www/html/tutorial/node9.html

（本文完）

猜你喜欢

转载自blog.csdn.net/baimafujinji/article/details/78992878

最大熵模型（MaxEnt）：万法归宗（上）

最大熵模型（MaxEnt）解析

最大信息熵模型Maxent软件

万法归宗——CGI

MaxEnt: 最大熵模型(Maximum Entropy Models)(一)

NLP学习记录（六）最大熵模型MaxEnt

MaxEnt（最大熵）模型使用方法-系统教程

万法归宗之Hadoop编程无界限

万剑归宗，redisson的百锁解构（上）

最大熵模型

最大熵模型（一）

最大熵模型

最大熵模型（三）

最大熵模型（二）

最大熵模型的学习

【算法】最大熵模型

最大熵模型推导

最大熵模型的理解

最大熵模型详解

精益敏捷万法归宗：把有意义的事，做到

机器学习——最大熵模型

逻辑回归与最大熵模型

最大熵模型与分类器

最大熵模型原理小结

最大熵模型和算法

最大熵模型python实现

ML-最大熵模型

NLP --- 最大熵模型的引入

机器学习 - 最大熵模型

深入解析最大熵模型

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)