1、讲讲朴素贝叶斯
朴素贝叶斯是基于贝叶斯定理和特征条件独立假设的分类方法。
2、朴素贝叶斯算法流程
- 获取训练样本,确定特征属性;
- 对每个类别计算类各个类的类先验概率;
- 对每个特征计算分属于各个类别的类条件概率;
- 对于一个样本,计算每个类别的类条件概率和各特征的类先验概率乘积
- 以第4步值最大的类别作为样本的所属类别;
其中,第2、3步时模型的训练阶段,第4、5步是应用阶段。
3、NB应用举例
常见问题(来源):
1.简述朴素贝叶斯算法原理和工作流程
2.什么是先验概率和后验概率?
先验概率是指根据以往经验和分析得到的概率。后验概率是基于新的信息,修正原来的先验概率后所获得的更接近实际情况的概率估计。
3.什么是条件概率?
条件概率是指事件A在另外一个事件B已经发生下发生的概率。
4.为什么朴素贝叶斯如此“朴素”?
因为假设所有特征在数据集中的作用是同等重要和独立的。
5.什么是贝叶斯决策理论?
6.朴素贝叶斯算法的前提假设是什么?
7.为什么属性独立性假设在实际情况中很难成立,但朴素贝叶斯仍能取得较好的效果?
8.朴素贝叶斯可以做多分类吗?
9.什么是朴素贝叶斯中的零概率问题?如何解决?
10.朴素贝叶斯中概率计算的下溢问题如何解决?
11.朴素贝叶斯分类器对异常值敏感吗?
12.当数据的属性是连续型变量时,朴素贝叶斯算法如何处理?
13.朴素贝叶斯算法对缺失值敏感吗?
14.朴素贝叶斯有哪几种常用的分类模型?
15.朴素贝叶斯算法中使用拉普拉斯平滑,拉普拉斯因子的大小如何确定?
16.为什么说朴素贝叶斯是高偏差低方差?
17.朴素贝叶斯为什么时候增量计算?
18.高度相关的特征对朴素贝叶斯有什么影响?
19.朴素贝叶斯的应用场景有哪些?
20.朴素贝叶斯有什么优缺点?