【AI数学原理】概率机器学习（三）：拉普拉斯修正 - 代码天地

【AI数学原理】概率机器学习（三）：拉普拉斯修正

其他 2018-06-02 05:07:50 阅读次数: 0

朴素贝叶斯分类器需要通过拉普拉斯修正来提高其鲁棒性。

本文需要上一篇博文的基础：【AI数学原理】概率机器学习（二）：朴素贝叶斯分类器

为什么不用拉普拉斯修正的NB分类器鲁棒性不理想呢？主要还是疏于考虑这种情况：

某个属性值在训练集中没有与某个类同时出现过。

当然，你可以说这是训练集的锅，但现实中的训练集就是逐渐增大的过程，你不能说训练集不够你这分类器就不行。记住：男人，不能说不行。
举个例子来说明原因：当某个属性‘才华’（取值有‘高’，‘中’，‘低’）和分类结果‘渣男’，而在训练数据中并没有‘才华’ = ‘中’和分类结果=‘渣男’的数据。所以用朴素贝叶斯分类器的时候，就会有：

P(才华=中|分类=渣男)=0
如上一篇博文所说，朴素贝叶斯公式就是一个累乘的公式，当因子中有一个为0，那结果就变为0了。这就是朴素贝叶斯鲁棒性不高的究极原因。
如果认真揣摸过上一篇博文的话，可以知道这种不稳定性只出现在离散取值属性中。当离散属性的每个取值没有被训练数据遍历到，就会出现这种问题。

拉普拉斯修正就解决了这个问题：
令N表示训练集D中可能的类别数，Ni表示第i个属性可能的取值数，把P(c)和P(xi|c)的公式分别修正为：

这里写图片描述

这样就算|Dc,xi| = 0，最后的P(xi|c)=1/(Dc+Ni)，不会变成0从而使全局归零。有效避免了因训练样本不充分而导致概率估值为0的问题。

猜你喜欢

转载自blog.csdn.net/leviopku/article/details/80152201

【AI数学原理】概率机器学习（三）：拉普拉斯修正

GCN与图谱理论（二）：拉普拉斯矩阵的数学原理

【AI数学原理】概率机器学习（一）：从贝叶斯公式开始

机器学习部分：拉普拉斯估计

拉普拉斯

【AI数学原理】概率机器学习（四）：半朴素贝叶斯之TAN算法实例

朴素贝叶斯（Naive Bayes）原理+编程实现拉普拉斯修正的朴素贝叶斯分类器

机器学习：贝叶斯分类器，朴素贝叶斯，拉普拉斯平滑

拉普拉斯变换

拉普拉斯平滑

拉普拉斯算子

拉普拉斯矩阵 *

拉普拉斯近似

拉普拉斯分布

拉普拉斯矩阵

【机器学习】Lasso回归（L1正则，MAP+拉普拉斯先验）

机器学习中拉普拉斯矩阵、散射矩阵、奇异矩阵、正定矩阵

【机器学习降维】拉普拉斯矩阵与谱聚类

OpenCV学习十九：Laplacian 拉普拉斯算子

理解卷积与拉普拉斯变化学习笔记

拉普拉斯变换学习笔记

傅里叶变换，拉普拉斯变换学习记录

机器学习之朴素贝叶斯（一）：朴素贝叶斯的介绍、概率基础（拉普拉斯平滑）、sklearn朴素贝叶斯实现API、朴素贝叶斯分类的优缺点、文本的特征工程

《机器学习(周志华)》笔记--贝叶斯分类器（2）--朴素贝叶斯分类器：先验概率、后验概率、条件概率、朴素贝叶斯表达式、拉普拉斯平滑

【AI数学原理】概率机器学习（二）：朴素贝叶斯分类器

Python 西瓜书拉普拉斯修正的朴素贝叶斯分类器（可以直接运行）

拉普拉斯平滑处理

Opencv Laplacian（拉普拉斯算子）

拉普拉斯边缘检测

拉普拉斯矩阵/特征映射

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)