文章目录
【一】 Directed Graph and Undirected Graph(有向图和无向图)
【二】 Joint Probability(联合概率)
- Directed Graph(有向图)
- Undirected Graph(无向图,运用 Clique 概念,每个 Clique 称为一个 Factor)
【三】 Log-Linear Model(LR,CRF)
- 表达式
【3.1】 Multinomial Logistic Regression(多元逻辑回归)
【3.2】 Linear-Chain CRF(Conditional Random Field)
- 时序表示
- Inference Problem(给定 W 和 X,求出 Y,和 HMM 里的 维特比算法 类似)
- Estimation of W(参数估计,求导 + 梯度下降,F / B 算法)
【四】 NER(应用例子)
【4.1】 CRF(单纯使用条件随机场,人为提取特征)
- 大体步骤
- 语料库(人民日报1998中文标注语料库) & 工具(CRF++安装包)
- 训练数据 & CRF++模板
【4.2】 Bi-LSTM + CRF(经典 NER 模型)
- 模型结构(CRF 的作用就是从概率上限制 Bi-LSTM 提取出来的特征)