机器学习基础:朴素贝叶斯分类器及其应用示例

版权声明:本文为博主原创文章,如需转载,请注明出处: https://blog.csdn.net/MASILEJFOAISEGJIAE/article/details/84488504

贝叶斯定理

\[
{ P(h|D)=\frac{P(D|h)P(h)}{P(D)} \tag{1}}
\]


贝叶斯分类

假设每一个实例 x x 可以用 n n 项特征来描述,分别为 a 1 , a 2 , . . . , a n a_1,a_2,...,a_n ,现有 m m 个类别,分别为 c 1 , c 2 , . . . , c m c_1,c_2,...,c_m 贝叶斯分类器的作用就是计算出概率最大的分类:
\[
c_{MAP}=
\mathop{\arg\max}\limits_{c_j \in C}
P(c_j|a_1,a_2,…,a_n)=
\mathop{\arg\max}\limits_{c_j \in C}\frac{P(a_1,a_2,…,a_n|c_j)P(c_j)}{P(a_1,a_2,…,a_n)}
\]

对于所有类别 c j c_j 来说, P ( a 1 , a 2 , . . . , a n ) P(a_1,a_2,...,a_n) 都是一样的,所以

\[
c_{MAP}=
\mathop{\arg\max}\limits_{c_j \in C}{P(a_1,a_2,…,a_n|c_j)P(c_j)}\tag{2}
\]
其中, P ( c j ) P(c_j) 先验概率 P ( a 1 , a 2 , . . . , a n c j ) P(a_1,a_2,...,a_n|c_j) 后验概率


朴素贝叶斯分类器

假设所有特征都相互条件独立,即
\[
P(a_1,a_2,…,a_n|c_j)=\prod_{i=0}^nP(a_i|c_j)
\]

则有朴素贝叶斯分类器公式
\[
c_{NB}=
\mathop{\arg\max}\limits_{c_j \in C}P(c_j)\prod_{i=0}^nP(a_i|c_j) \tag{3}
\]


示例

某人根据天气状况打网球的情况如下表:

图片来源:https://xueqiu.com/5097325825/82965562

其中,天气状况由天气、温度、适度和风力4个特征来描述。
问题:根据<sunny, cool, high, strong>构成的天气状况来预测此人是否会打网球。

该问题可看作分类问题,将上述特征所构成的实例进行分类,共有“打网球”和“不打网球”2个类。

设事件"+“为打网球,事件”-"为不打网球,则有
\[
P(+)P(sunny|+)P(cool|+)P(high|+)P(strong|+)=\frac{9}{14}\frac{2}{9}\frac{3}{9}\frac{3}{9}\frac{3}{9} \approx 0.005
\]
\[
P(-)P(sunny|-)P(cool|-)P(high|-)P(strong|-)=\frac{5}{14}\frac{3}{5}\frac{1}{5}\frac{4}{5}\frac{3}{5} \approx 0.021
\]

根据公式(3),选概率最大时的分类“-”,所以此人不打网球。


参考资料:

  1. 朴素贝叶斯分类器的应用 - 阮一峰的网络日志
  2. 算法杂货铺——分类算法之朴素贝叶斯分类 - 张洋
  3. 朴素贝叶斯分类器 - 小硒—代码无疆 - CSDN博客

猜你喜欢

转载自blog.csdn.net/MASILEJFOAISEGJIAE/article/details/84488504