1. 准确率、召回率和F1值。
2. 线性分类器最佳准则:
只有三个准则,即感知器准则、SVM和Fisher准则,贝叶斯分类器不是线性分类器。只有特定的某些朴素贝叶斯分类器是线性分类器。
1) 感知器准则:以使错分类样本到分界面距离之和最小为原则。感知器是神经网络的基础。
2) SVM:使两类之间的间隔最大,优化目标是最大化间隔,又称最大化间隔分类器,是一种典型的线性分类器(使用核函数可以解决非线性问题)。
3) Fisher准则:更广泛的称呼是线性判别分析。思想是将所有的样本映射到一条直线上,使得同类样本的点间距离尽可能地小,不同类样本的点间距离尽可能地大,使得类内密集,类间分离。这种度量是通过类内离散矩阵Sw和类间离散矩阵Sb实现的。
4) 贝叶斯分类器:基于统计方法的分类器,需要先了解样本的分布情况(高斯、指数等),使用起来的限制比较多。在满足一些特定的条件之下,其优化的目标与线性分类器有相同的结构(同方差,高斯分布等),其它条件下不是线性分类。
参考:http://blog.163.com/rustle_go_go/blog/static/20294501420122110431306/
3. 影响聚类效果的主要原因有:
1)特征选择;2)模式相似性度量;3)分类准则。
4. 关于线性回归的描述中正确的是:
1)基本假设包括随机干扰项是均值为0的同方差正态分布;
2)在违背基本假设时,普通最小二乘法估计量不再是最佳线性无偏估计量;
3)可以用DW检验残差是否存在序列相关性。
杜宾-瓦特森(DW)检验,计量经济,统计分析中常用的一种检验序列一阶自相关最常用的方法。
5.CRF模型对于HMM和MEMM模型的优势:
特征灵活,可以容纳较多的上下文信息,全局最优。
https://blog.csdn.net/foolsnowman/article/details/50640928
缺点:速度慢。