情感分析入门[2]-一些数学工具

写一些看早期论文常常出现的数学工具

教程很多,珠玉在前,不多写,只做个备忘。


1. 朴素贝叶斯

伯努利型贝叶斯或者多项式型贝叶斯,SEEM5680text mining 学了。比较熟悉,不写了。主要就是考虑词的出现与否/出现次数,与该分类的相关程度;

2. 隐马尔可夫模型[HMM]

最早是在seq2seq了解到这个模型,今天再回顾一下。

ref:

https://www.cnblogs.com/skyme/p/4651331.html

http://www.cnblogs.com/en-heng/p/6164145.html

首先讲一下最大熵模型(MaxEnt),保留所有(不自相矛盾的)可能信息来预测概率,计算量巨大,可用于机器翻译,句法标注等。

然后讲HMM,经典的骰子模型可以体现隐含状态链与可见状态链,转换概率,输出概率等概念,可用于已知一部分参数,求另一些。一般有三个问题:

1.概率计算

2.学习可见状态,使生成可见状态的概率最大

3.解码,已知可见状态与模型,求隐含状态链

3. MEMM最大熵马尔可夫

MEMM直接学习条件概率:给定前一状态和当前观测的情况下,输出当前状态的概率。

问题:标注偏置,有更多状态转移可能的状态比重会偏小

4.CRF

Conditional HMM,做了全局归一化,从了避免了local bias

Ref:https://www.cnblogs.com/en-heng/p/6214023.html

猜你喜欢

转载自www.cnblogs.com/para10969/p/10054969.html