牛客网机器学习笔记(3)

1. 准确率、召回率和F1值。

2. 线性分类器最佳准则:

只有三个准则,即感知器准则、SVM和Fisher准则,贝叶斯分类器不是线性分类器。只有特定的某些朴素贝叶斯分类器是线性分类器。

1) 感知器准则:以使错分类样本到分界面距离之和最小为原则。感知器是神经网络的基础。

2) SVM:使两类之间的间隔最大,优化目标是最大化间隔,又称最大化间隔分类器,是一种典型的线性分类器(使用核函数可以解决非线性问题)。

3) Fisher准则:更广泛的称呼是线性判别分析。思想是将所有的样本映射到一条直线上,使得同类样本的点间距离尽可能地小,不同类样本的点间距离尽可能地大,使得类内密集,类间分离。这种度量是通过类内离散矩阵Sw和类间离散矩阵Sb实现的。

4) 贝叶斯分类器:基于统计方法的分类器,需要先了解样本的分布情况(高斯、指数等),使用起来的限制比较多。在满足一些特定的条件之下,其优化的目标与线性分类器有相同的结构(同方差,高斯分布等),其它条件下不是线性分类。

参考:http://blog.163.com/rustle_go_go/blog/static/20294501420122110431306/

3. 影响聚类效果的主要原因有:

1)特征选择;2)模式相似性度量;3)分类准则。

4. 关于线性回归的描述中正确的是:

1)基本假设包括随机干扰项是均值为0的同方差正态分布;

2)在违背基本假设时,普通最小二乘法估计量不再是最佳线性无偏估计量;

3)可以用DW检验残差是否存在序列相关性。

杜宾-瓦特森(DW)检验,计量经济,统计分析中常用的一种检验序列一阶自相关最常用的方法。

5.CRF模型对于HMM和MEMM模型的优势:

特征灵活,可以容纳较多的上下文信息,全局最优。

https://blog.csdn.net/foolsnowman/article/details/50640928

缺点:速度慢。


猜你喜欢

转载自blog.csdn.net/qq_33335553/article/details/80992742