数学之美：期望最大化算法 - 代码天地

数学之美：期望最大化算法

其他 2018-10-13 20:29:48 阅读次数: 0

前面多次介绍到文本分类，一是互联网各方面都会用到这些技术，另一方面这些技术几乎可以用到所用分类中。如用户分类、词分类、商品分类、甚至生物特征和基因分类等。在文本分类中有个极其强大的技术：期望最大化算法。

文本的自收敛分类：

期望最大化和收敛的必然性：

我们的目的是相近的点都被聚集到一个类别。同一类中各个点到中心的平均距离d较小，而不同类别间的中心的平均距离D较大。我们希望每一个迭代都会d比以前小，而D比以前大。

将上面思想推广至一般机器学习，实际上包括两个过程和一个目标函数。

1、根据现有聚类结果，对所有数据点进行重新划分。

2、根据重新划分结果，得到新的聚类。

3、整个流程最大化目标就是点到聚类中心距离d和类间距离D。

首先计算各个观测数值输入到模型的结果，这过程叫做期望值计算过程；然后重新计算模型以最大化期望值成为最大化过程。这类算法统称为EM算法（Expectation Maximization）。

前面介绍到的很多算法其实都是EM算法。如隐马尔可夫模型中的训练算法Baum-Welch，E过程根据现有模型计算每个状态之间转移次数和每个状态的输出次数，M过程就是根据这些次数重新估算隐马尔科夫模型的参数。其最大化目标函数是观测值的概率。以及最大熵模型的训练算法GIS算法，E过程利用现有模型计算每个特征的数学期望值，M过程就是根据这些特征的数学期望和实际观测值的比值，调整模型参数，最大化目标函数是熵函数。

另外EM算法是否能够获得全局最优解？如果我们的目标函数是凸函数，那么一定可以获得全局最优解。而我们的熵函数是凸函数，如果在N维空间使用欧式距离做度量，聚类中我们试图优化的两个函数也是凸函数。但很多情况，如文本分类中的余弦距离不能保证是凸函数，因此EM算法有可能给出局部最佳解。吴军大牛称之为上帝算法。

猜你喜欢

转载自blog.csdn.net/qq_16234613/article/details/82838533

数学之美：期望最大化算法

EM算法（期望最大化算法）

最大化期望算法（EM）详解

期望最大化EM

EM算法（Expectation Maximization）期望最大化算法

EM（期望最大化）算法初步认识

似然估计与期望最大化（EM）算法

第八讲：期望最大化算法(EM algorithm)

机器学习之期望最大化（EM）

机器学习算法（优化）之二：期望最大化（EM）算法

NLP --- 隐马尔可夫HMM（EM算法（期望最大化算法））

机器学习面试必知：高斯混合模型GMM和期望最大化EM算法

机器学习基础：期望最大化算法（Machine Learning Fundamentals: EM Algorithm）

期望最大化（EM）算法：从理论到实战全解析

期望最大化&k-means聚类

期望最大化注意力网络 EMANet

最大化

利润最大化

最大后验概率、最大似然、期望最大化

简单的算法题-总收益最大化

算法——Coin-row problem（币值最大化问题）

贪心算法实现月饼销售收益的最大化

机器学习实战：Python基于EM期望最大化进行参数估计（十五）

从期望最大化（EM）到变分自编码器（VAE）

贪心之月饼利润最大化问题

tkinter窗口最大化

贷款利润最大化

Qt窗口最大化

ubuntu桌面最大化

拉氏最大化

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)