写一些看早期论文常常出现的数学工具
教程很多,珠玉在前,不多写,只做个备忘。
1. 朴素贝叶斯
伯努利型贝叶斯或者多项式型贝叶斯,SEEM5680text mining 学了。比较熟悉,不写了。主要就是考虑词的出现与否/出现次数,与该分类的相关程度;
2. 隐马尔可夫模型[HMM]
最早是在seq2seq了解到这个模型,今天再回顾一下。
ref:
https://www.cnblogs.com/skyme/p/4651331.html
http://www.cnblogs.com/en-heng/p/6164145.html
首先讲一下最大熵模型(MaxEnt),保留所有(不自相矛盾的)可能信息来预测概率,计算量巨大,可用于机器翻译,句法标注等。
然后讲HMM,经典的骰子模型可以体现隐含状态链与可见状态链,转换概率,输出概率等概念,可用于已知一部分参数,求另一些。一般有三个问题:
1.概率计算
2.学习可见状态,使生成可见状态的概率最大
3.解码,已知可见状态与模型,求隐含状态链
3. MEMM最大熵马尔可夫
MEMM直接学习条件概率:给定前一状态和当前观测的情况下,输出当前状态的概率。
问题:标注偏置,有更多状态转移可能的状态比重会偏小
4.CRF
Conditional HMM,做了全局归一化,从了避免了local bias
Ref:https://www.cnblogs.com/en-heng/p/6214023.html