机器学习（五）：朴素贝叶斯法 - 代码天地

机器学习（五）：朴素贝叶斯法

编程语言 2019-04-12 10:30:52 阅读次数: 0

版权声明：欢迎转载，转载请注明出处！ https://blog.csdn.net/weixin_40871455/article/details/89099184

朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集，首先基于特这条件独立假设学习输入/输出的联合概率分布；然后基于此模型，对于给定的输入x，利用贝叶斯定理求出后验概率最大的输出y。朴素贝叶斯法实现简单，学习与预测的效率都和高，是一种常用的方法。

什么是条件概率？

所谓"条件概率"（Conditional probability），就是指在事件B发生的情况下，事件A发生的概率，用P(A|B)来表示。

根据文氏图，可以看到在事件B发生的情况下，事件A发生的概率就是P(A∩B)除以P(B)。
即：P(A|B)=P(A∩B) / P(B)，--> P(A∩B) = P(A|B)P(B)，同理，P(A∩B) = P(B|A)P(A)，所以，P(A|B)P(B) = P(B|A)P(A)
所以：P(A|B) = P(B|A)P(A) / P(B)，这就是贝叶斯公式。

朴素贝叶斯原理

朴素贝叶斯法通过训练数据集学习联合概率分布P(X,Y)。首先学习先验概率分布及条件概率分布，然后相乘得到联合概率分布。

先验概率分布：

条件概率分布：

这里表示特征向量，表示特征向量中的第一个特征值，一个表示一个训练数据中的

朴素贝叶斯法对条件概率分布作了条件独立性的假设。条件独立假设是：

条件独立性假设是说用于分类的特征在类确定的条件下都是条件独立的。朴素贝叶斯法实际上学习到生成数据的机制，所以属于生成模型。

我们正常的需求是根据输入x，通过学习到的模型计算在x的条件下y的概率，也就是计算后验概率

根据贝叶斯定理：

将（4.3）代入（4.4）：

于是，朴素贝叶斯分类器可表示为：

因为分母是相同的，所以：

后验概率最大化由何而来

上式（4.6）中我们对（4.5）取了最大值，即满足的最大的那个才是我们需要的分类，我们选择了后验概率最大的那个分类，这是为什么呢？

将一个输入x分到后验概率最大的类中，等价于期望风险最小化，假设我们选择0-1损失函数：

f(X)为分类决策函数，这时，期望风险函数为：

期望是对联合分布 P(X,Y) 取的，由此取条件期望：

为了使期望风险最小化，只需对X=x逐个极小化，由此得到：

这样，根据期望风险最小化准则就得到了后验概率最大化准则：

朴素贝叶斯的参数估计

极大似然估计

朴素贝叶斯是生成模型，我们需要知道联合概率分布P(X,Y)，所以需要学习和，使用极大似然估计先验概率：

为指示函数。设第j个特征可能取值的集合为，条件概率的极大似然估计为：

这样有了条件概率，有了Y的先验概率，我们就可以通过求上面的（4.7）式，得出后验概率最大的分类

算法1：朴素贝叶斯算法：

（1）计算先验概率及条件概率（也就是我们上面提及的两个公式）

（2）对于给定的示例，计算

（3）确定实例x的分类

例子：

猜你喜欢

转载自blog.csdn.net/weixin_40871455/article/details/89099184

机器学习（五）：朴素贝叶斯法

朴素贝叶斯法【机器学习】

机器学习（五）朴素贝叶斯

【机器学习算法】：朴素贝叶斯法

【机器学习算法】朴素贝叶斯法

机器学习——朴素贝叶斯法提要

机器学习（三）------朴素贝叶斯法

浅谈机器学习—朴素贝叶斯法

机器学习之朴素贝叶斯法

机器学习十大算法之五：朴素贝叶斯法

机器学习笔记(五)——轻松看透朴素贝叶斯

机器学习中的贝叶斯与朴素贝叶斯

【机器学习】朴素贝叶斯-贝叶斯公式

机器学习——贝叶斯和朴素贝叶斯

朴素贝叶斯法的学习

机器学习之朴素贝叶斯

机器学习（一）—朴素贝叶斯

机器学习(十)朴素贝叶斯

《机器学习实战》——朴素贝叶斯

《机器学习之朴素贝叶斯》

机器学习——朴素贝叶斯

机器学习笔记：朴素贝叶斯

机器学习：朴素贝叶斯理解

机器学习-朴素贝叶斯原理

机器学习----朴素贝叶斯

机器学习----朴素贝叶斯详解

机器学习面试--朴素贝叶斯

机器学习-朴素贝叶斯

机器学习实战 -- 朴素贝叶斯

机器学习—监督—朴素贝叶斯

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)