朴素贝叶斯分类的M估计推导 - 代码天地

朴素贝叶斯分类的M估计推导

企业开发 2018-05-31 07:03:32 阅读次数: 0

在使用朴素贝叶斯方法进行文本分类时，如果待分类的文本包含某个属性值在训练样本中不存在，则类条件概率为0，

这时候算出的所有类别的后验概率都是0，导致无法对文本分类。一般可采用M估计（M-Estimate）来平滑类条件概率的计算，从而得到非0的可比较的近似概率值，达到分类的目的。

设文本由一个属性向量x=(x1,x2,x3,...xn)表示，给定分类集合Y={yj|yj 属于Y}

求文本向量的一个属性xi 对于分类yj的类条件概率P(xi|yj)。

首先假设Nyj 是分类yj的样本总数，Nxi是包含属性xi且属于分类yj的样本数。

由概率知识得到：

P(xi|yj) = Nxi / Nyj ------公式1

如果采用M-Estimate，得到的公式是

P(xi|yj) = (Nxi + mp) / (Nyj + m) ------公式2

其中p是 P(xi|yj) 的近似值，即有 Nxi / Nyj ~= p

由公式1和p逐步推导出公式2的过程如下：

为简化起见，设 a = Nyj, b = Nxi，则 p ~= b / a, 可得：

P(xi | yj) = b / a

= b(a+m) / a(a+m)

= (ba + bm) / a(a+m)

= (b + m*(b/a)) / (a+m)

~= (b + mp) / (a+m) -------- 用 p ~= b / a 代入。

= (Nxi + mp) / (Nyj + m)

得证。

M估计的实际应用：

1. 多项式模型：

m = |V|，p = 1/|V|, 这里|V|为样本空间V的词库大小。

2. 伯努利模型：

m = 2， p = 1/2

至于为什么m取2，我还没弄懂，期待有知道的朋友分享一下。

猜你喜欢

转载自ocre.iteye.com/blog/1356067

朴素贝叶斯分类的M估计推导

朴素贝叶斯（分类）推导

朴素贝叶斯分类算法公式推导

朴素贝叶斯分类

朴素贝叶斯---分类

分类-朴素贝叶斯

分类_朴素贝叶斯

Python(朴素贝叶斯/贝叶斯估计)

朴素贝叶斯算法推导

朴素贝叶斯算法-推导总结

朴素贝叶斯算法的推导与实践

最大似然估计、最大后验估计与朴素贝叶斯分类算法

分类：朴素贝叶斯分类方法

朴素贝叶斯--文档分类

分类方法之朴素贝叶斯

朴素贝叶斯分类算法

一、朴素贝叶斯分类

分类算法-朴素贝叶斯NB

朴素贝叶斯方法的学习与分类

分类之朴素贝叶斯方法

机器学习-朴素贝叶斯分类

朴素贝叶斯分类（Nave Bayes）

AI 朴素贝叶斯分类

朴素贝叶斯分类MATLAB实现

朴素贝叶斯分类--笔记

朴素贝叶斯分类算法原理

sklearn朴素贝叶斯分类

朴素贝叶斯算法，对男女分类

分类算法之朴素贝叶斯

文本分类--朴素贝叶斯

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)