李宏毅深度学习笔记（五）分类：概率生成模型(Probabilistic Generative Model)——朴素贝叶斯

其他 2020-01-11 00:29:40 阅读次数: 0

朴素贝叶斯的引入

假设我们有两个盒子，第一个盒子里有大小形状相同的4颗蓝球，1颗绿球；第二个盒子里有大小形状相同的2颗蓝球，3颗绿球。我们从两个盒子里任取一颗球是蓝球，问这颗蓝球从第一个盒子里面取出的概率是多少？
这就是后验概率的问题，根据贝叶斯定理计算如下：

$P(B_1|Blue)=\frac{P(Blue|B_1)P(B_1)}{P(Blue|B_1)+P(Blue|B_2)P(B_2)}$

将上述例子一般化之后就如下图所示：
在这里插入图片描述
若 $x$ 是蓝色，则 $P(x|C_1)=\frac{4}{5}$ , $P(C_1)=\frac{5}{10}=\frac{1}{2}$ , $P(x|C_2)=\frac{2}{5}$ , $P(C_2)=\frac{5}{10}=\frac{1}{2}$

通过上面的推论我们知道了如何求取一个新给的样本属于各个类别的概率，但上面所讲的是在一个封闭的系统（ $x$ 只能从两个盒子里面抽取）里面的概率，且我们可以直接看出两个类别的概率分布。然而，在实际的应用中我们往往没有某一个类别精确的概率分布，我们的训练集也无法穷举所有的可能性，这时候就要求我们对一个类别求取一个最符合它样本分布的概率模型，以便我们在这个概率模型下计算 $P(x|C_i)$ 。

如何求取概率模型

我们先假设数据的概率分布（正态、伯努利、播送、···），然后用概率公式去计算 $x$ 属于的类型 $P(C_1|x)$ 。
一般的，我们假设 $x$ 为高斯分布，这是由概率论中的中心极限定理所得来的。

多维高斯分布：
在这里插入图片描述
其中均值为 $\mu$ ，协方差为 $\sum$
这里举个例子来看一下不同的 $\mu$ 和 $\sum$ 对分布的影响：

接下来就是求取这个假设的分布中的参数 $\mu$ 和 $\sum$ 了，这里用极大似然估计来求取。比如说我们用某个模型生成了下图所示的79个样本点，那么我们的目的就是要求最有可能生成这79个样本点的模型，即求出这个模型的 $\mu$ 和 $\sum$ 。
在这里插入图片描述
这里我们用下面的极大似然估计的函数：

我们按照上式和两个类别的训练集来求出两个类别的极大似然估计函数的系数(第一个类别中有79个样本，第二个类别中有61个样本)：
在这里插入图片描述

分类

接下来就可以将分布函数带入到贝叶斯函数中来进行分类了：
在这里插入图片描述
如果 $P(C_1|x)>0.5$ 则可以推出 $x$ 是属于第一类的。

但通常情况是两个模型会共用一个 $\sum$ ，那么似然函数就变成了：
在这里插入图片描述
这个式子中的 $\mu_1$ 和 $\mu_2$ 和上面的式子中是一样的， $\sum=\frac{79}{140}\sum^1+\frac{61}{140}\sum^2$

这个时候就变成了线性分类：
在这里插入图片描述
可以看到上面的模型分类准确率并不高，这可能是特征值选取的比较少，在增加特征值之后会好很多。

comli_cn

发布了26 篇原创文章 · 获赞 11 · 访问量 1532

私信关注

猜你喜欢

转载自blog.csdn.net/comli_cn/article/details/102984837

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)