机器学习入门课程(4) —— 隐马尔可夫模型/ CRF条件随机场/ LDA主题模型以及生成模型V.s判别模型 - 代码天地

机器学习入门课程(4) —— 隐马尔可夫模型/ CRF条件随机场/ LDA主题模型以及生成模型V.s判别模型

其他 2020-03-17 10:24:01 阅读次数: 0

一、隐马尔可夫模型

隐马尔可夫模型是一个关于时序的概率模型，描述由隐马尔科夫链随机生成观测序列的过程，属于生成模型。
隐马尔科夫模型在语音识别、自然语言处理、生物信息等领域有着广泛的应用。

马尔可夫模型的两个假设

齐次马尔可夫假设：假设隐藏的马尔科夫链在任意时刻t的状态只依赖于前一时刻的状态，与其它时刻的状态及观测无关，也与时刻t无关。
观测独立性假设：假设任意时刻的观测只依赖于该时刻的马尔科夫链的状态，与其他观测及状态无关。

隐马尔可夫模型 λ = (A, B, Π) ，状态转移概率矩阵A，初始状态概率向量Π，确定了隐藏的马尔科夫链，生成不可观测的状态序列。观测概率矩阵B确定了如何从状态生成观测，与状态序列综合确定了如何产生观测序列。

隐马尔可夫模型的三个基本问题

概率计算问题：给定模型 λ = (A, B, Π) 和观测序列O = (o₁, o₂,…,o_T)，计算在模型 λ 下观测序列 O 出现的概率 P = (O|λ)；
学习问题：已知观测序列O = (o₁, o₂,…,o_T)，估计模型参数 λ = (A, B, Π) ，使得在该模型下观测序列概率 P = (O|λ) P = (O|λ)最大；
预测问题：已知模型 λ = (A, B, Π) 和观测序列O = (o₁, o₂,…,o_T)，求对给定观测序列条件概率 P = (I|O)最大的状态序列。即给定观测序列，求最有可能的对应的状态序列。

应用：词性标注、中文分词、天气预测等。

二、CRF条件随机场

CRF条件随机场是一个序列标注模型，其优点在于为一个位置标注的过程中可以利用丰富的内部及上下文特征信息。
应用场景：分词（标注字的词位信息，由字构词）、词性标注（标注分词的词性，例如名词动词助词等）、命名实体识别（识别人名、地名、机构名等实体名词）。

三、LDA主题模型

LDA主题模型是一种文档主题生成模型，是一种非监督机器学习技术。通过模拟文档生成过程，可以用来识别大规模文档集或语料库中潜藏的主题信息。

生成模型 V.s. 判别模型

监督学习方法可以分为两大类，即生成方法和判别方法，对应的模型称为生成模型和判别模型。

生成方法的特点

从统计的角度表述数据的分布情况，能够反映同类数据本身的相似度；
生成方法还原出联合概率分布，而判别方法不能；
生成方法的学习收敛速度更快，即当样本容量增加的时候，学到的模型可以更快的收敛于真实模型；
当存在隐变量时，仍然可以用生成方法学习，此时判别方法不能用。

判别方法的特点：

判别方法寻找不同类别之间的最优分类面，反应异类数据之间的差异；
判别方法利用了训练数据的类别标识信息，直接学习的是条件概率 P(Y|X) 或者决策函数 f(x) ，直接面对预测，往往学习的准确率更高；
由于直接学习条件概率 P(Y|X) 或者决策函数 f(x) ，可以对数据进行各种程度上的抽象，定义特征并使用特征，因此可以简化学习问题；
缺点是不能反映训练数据本身的特性。

发布了76 篇原创文章 · 获赞 30 · 访问量 5827

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_45926367/article/details/104836236

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)