从概率分布的角度看待模型。
给个例子感觉一下: 如果我想知道一个人A说的是哪个国家的语言,我应该怎么办呢?
- 生成式模型
我把每个国家的语言都学一遍,这样我就能很容易知道A说的是哪国语言,并且C、D说的是哪国的我也可以知道,进一步我还能自己讲不同国家语言。
- 判别式模型
我只需要学习语言之间的差别是什么,学到了这个界限自然就能区分不同语言,我能说出不同语言的区别,但我哦可能不会讲。
如果我有输入数据 x ,并且想通过标注 y 去区分不同数据属于哪一类,生成式模型是在学习样本和标注的联合概率分布
而判别式模型是在学习条件概率
生成式模型
可以通过贝叶斯公式转化为
,并用于分类,而联合概率分布
也可用于其他目的,比如用来生成样本对
判别式模型的主要任务是找到一个或一系列超平面,利用它(们)划分给定样本到给定分类,这也能直白的体现出“判别”模型这个名称。
最后给一个很简单的例子说明一下:
假如我有以下独立同分布的若干样本 (x,y) ,其中 x 为特征,
为标注,
则:
一些理论可看:On Discriminative vs Generative classifiers: A comparison of logistic regression and naive Bayes。
- 常见生成式模型
Naive Bayes
Gaussians
Mixtures of Gaussians
Mixtures of Experts
Mixtures of Multinomials
HMM
Markov random fields
Sigmoidal belief networks
Bayesian networks - 常见判别式模型
Linear regression
Logistic regression
SVM
Perceptron
Traditional Neural networks
Nearest neighbor
Conditional random fields