【机器学习笔记】《统计学习方法》第四章朴素贝叶斯法 - 代码天地

【机器学习笔记】《统计学习方法》第四章朴素贝叶斯法

其他 2021-01-30 20:34:14 阅读次数: 0

主要参考书目《统计学习方法》第2版，清华大学出版社
参考书目 Machine Learning in Action, Peter Harrington
用于考研复试笔记，所以写的很简洁，自己能看懂就行。有学习需求请绕道，参考吴恩达机器学习或以上书籍，讲得比大多数博客好。

概念

朴素贝叶斯法（naive Bayes)对条件概率分布做了条件独立性的假设。由于这是一个较强的假设，朴素贝叶斯法也由此得名。
$P(X=x|Y=c_k)=P(X^{(1)}=x^{(1)},...,X^{(n)}=x^{(n)}|Y=c_k)=\prod\limits_{j=1}^nP(X^{(j)}=x^{(j)}|Y=c_k)$

就是说，对于每一种属性发生的概率，是它每一个维度的值发生的概率的乘积

$y=\argmax_{c_k}P(Y=c_k)\prod\limits_j P(X^{(j)}=x^{(j)}|Y=c_k)$

原理

极大似然估计

算法4.1朴素贝叶斯算法(naïve Bayes algorithm)
输入：训练数据 $T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$ ，其中 $x_i=(x_i^{(1)},x_i^{(2)},...,x_i^{(n)})^{T}$ ， $x_i^{(j)}$ 是第 $i$ 个样本的第 $j$ 个特征， $x_i^{(j)} \in \{a_{j1},a_{j2},...,a_{js_j}\}$ ， $a_{jl}$ 是第 $j$ 个特征可能取的第 $l$ 个值， $l=1,2,...,S_j,y_j \in \{c_1,c_2,...,c_k\}$ ；实例 $x$ ；
输出：实例 $x$ 的分类

比如要判断 $x=(2,S)^T$ 是哪一类
$P(Y=1)P(X^{(1)}=2|Y=1)P(X^{(2)}=S|Y=1)=\frac{1}{45}$
$P(Y=-1)P(X^{(1)}=2|Y=-1)P(X^{(2)}=S|Y=-1)=\frac{1}{15}$
所以它属于-1类

贝叶斯估计

为了防止要估计的概率值为0的情况设 $\lambda>0$
$P_{\lambda}(X^{(j)}=a_{jl}|Y=c_k)=\frac{\sum\limits_{i=1}^{(j)}I(x_i^{(j)}=a_{jl},y_i=c_k)+\lambda}{\sum\limits_{i=1}^NI(y_i=c_k)+S_j\lambda}$

当 $\lambda=0$ 时，为极大似然估计，当 $\lambda=1$ 时，为拉普拉斯平滑(Laplacian smoothing)

猜你喜欢

转载自blog.csdn.net/weixin_43269437/article/details/113136686

【机器学习笔记】《统计学习方法》第四章朴素贝叶斯法

《统计学习方法》第四章朴素贝叶斯法

李航《统计学习方法》学习笔记之——第四章：朴素贝叶斯法

《统计学习方法》第四章: 朴素贝叶斯法读书笔记

《统计学习方法》笔记---第四章：朴素贝叶斯

《统计学习方法》：第四章：朴素贝叶斯

《统计学习方法》第四章，朴素贝叶斯

统计学习方法第四章：朴素贝叶斯法(naive Bayes)，贝叶斯估计及python实现

李航统计学习第四章-朴素贝叶斯法

统计学习方法——第四章朴素贝叶斯及c++实现

《统计学习方法》——第四章朴素贝叶斯及C++实现

统计学习方法 | 朴素贝叶斯法

《统计学习方法》——朴素贝叶斯法

第四章朴素贝叶斯法

统计学习方法——第4章朴素贝叶斯法（个人笔记）

【统计学习方法-李航-笔记总结】四、朴素贝叶斯法

统计学习方法读书笔记（四）-朴素贝叶斯法

朴素贝叶斯法【机器学习】

朴素贝叶斯法的学习

（四）朴素贝叶斯法

《统计学习方法》第4章朴素贝叶斯法与贝叶斯估计

统计学习笔记（4）——朴素贝叶斯法

【统计学习笔记】朴素贝叶斯法

【李航-统计学习方法】【原理与代码】第四章朴素贝叶斯 Naive Bayes python C++

统计学习方法学习笔记（九）：朴素贝叶斯法

《统计学习方法》第4章朴素贝叶斯法

统计学习方法：朴素贝叶斯法 (四)

统计学习方法笔记（八）朴素贝叶斯法

统计学习方法笔记-朴素贝叶斯法

统计学习方法笔记——朴素贝叶斯法

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)