机器学习笔记3——朴素贝叶斯算法（分类） - 代码天地

机器学习笔记3——朴素贝叶斯算法（分类）

其他 2018-08-12 19:16:12 阅读次数: 0

1、贝叶斯公式

贝叶斯公式众所周知，推到也比较简单，这里直接写出结果

p (A | B) = p (A) p ( B | A ) p ( B )

$p(A|B)=p(A)\frac{p(B|A)}{p(B)}$ 其中

p(A) $p(A)$ 称为先验概率，

p(A|B) $p(A|B)$ 称为后验概率。贝叶斯公式的意义就在于，事件B的发生对事件A的概率产生了影响，影响系数就是

p(B|A)p(B) $\frac{p(B|A)}{p(B)}$

2、朴素贝叶斯

2.1 训练数据集

训练数据集 $(\vec{x}_k,y_k),y_k\in {c_1,c_2,\cdots,c_K}$

2.2 模型

输入： $\vec{x}=(a_1,a_2,\cdots,a_n)$
要判断其分类，需要找出使得 $p(y=c_k|\vec{x})$ 最大的 $c_k$ ， $k=1,2,\cdots,K$
根据贝叶斯公式可知，

p (y = c k | x ⃗) = p (y = c k) p ( x ⃗ | y = c k ) p ( x ⃗ )

$p(y=c_k|\vec{x})=p(y=c_k)\frac{p(\vec{x}|y=c_k)}{p(\vec{x})}$
朴素贝叶斯的“朴素”二字的意义在于，假设输入

x⃗ i $\vec{x}_i$ 中的各个特征

a1,a2,⋯,an $a_1,a_2,\cdots,a_n$ 都是相互独立的。因此，

p (x ⃗ | y = c k) = p (a 1 | y = c k) p (a 2 | y = c k) \dots p (a n | y = c k)

$p(\vec{x}|y=c_k)=p(a_1|y=c_k)p(a_2|y=c_k)\cdots p(a_n|y=c_k)$ 贝叶斯公式的求解将变得简单，其中

p(x⃗ ) $p(\vec{x})$ 可以用全概率公式求解。剩下的问题就是求解

p(y=ck) $p(y=c_k)$ 和

p(ai|y=ck) $p(a_i|y=c_k)$ ，常用的方法有极大似然估计和贝叶斯估计。

2.3.1 极大似然估计

假设样本总数为 $N$ ，那么先验概率 $p(y=c_k)$ 即属于 $c_k$ 的样本数/总样本数 $N$

p (y = c k) = \sum N i = 1 I ( y i = c k ) N

$p(y=c_k)=\frac{\sum_{i=1}^N{I(y_i=c_k)}}{N}$ 而

p(ai|y=ck) $p(a_i|y=c_k)$ 即

ck $c_k$ 类的样本中

ai $a_i$ 出现的次数/

ck $c_k$ 类的样本数

p (a i | y = c k) = \sum N i = 1 I ( y i = c k , x k i = a i ) \sum N i = 1 I ( y i = c k )

$p(a_i|y=c_k)=\frac{ \sum_{i=1}^N{I(y_i=c_k,x_{ki}=a_i)} } { \sum_{i=1}^N{I(y_i=c_k)} }$

3.实例python实现

猜你喜欢

转载自blog.csdn.net/qsdzxp/article/details/79703061

机器学习笔记3——朴素贝叶斯算法（分类）

机器学习学习笔记朴素贝叶斯分类笔记

Python机器学习--分类算法--朴素贝叶斯算法

机器学习经典算法——朴素贝叶斯分类算法

朴素贝叶斯分类算法——机器学习

机器学习之朴素贝叶斯分类算法

机器学习分类算法之朴素贝叶斯

机器学习算法--朴素贝叶斯分类

机器学习经典算法之朴素贝叶斯分类

【机器学习】分类算法 - 朴素贝叶斯 MultinomialNB

机器学习实战笔记：朴素贝叶斯分类

机器学习入门笔记（四）：朴素贝叶斯分类

机器学习-朴素贝叶斯分类

机器学习——朴素贝叶斯分类

《机器学习实战》学习笔记：朴素贝叶斯分类算法

机器学习--朴素贝叶斯分类算法学习笔记

机器学习——分类算法3：朴素贝叶斯（Bayes）思想和代码解释

机器学习算法笔记--------朴素贝叶斯

Python机器学习笔记：朴素贝叶斯算法

机器学习——朴素贝叶斯算法相关笔记

机器学习——朴素贝叶斯算法

机器学习算法朴素贝叶斯

机器学习---算法---朴素贝叶斯

机器学习算法——朴素贝叶斯

机器学习：朴素贝叶斯算法

【机器学习】朴素贝叶斯算法

机器学习实战笔记3—朴素贝叶斯

机器学习笔记：朴素贝叶斯

机器学习笔记-朴素贝叶斯

机器学习之朴素贝叶斯（二）：朴素贝叶斯算法案例——新闻分类

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)