【机器学习实战】 Bayes - 代码天地

【机器学习实战】 Bayes

其他 2018-06-05 12:12:32 阅读次数: 1

贝叶斯公式：

P (H | D) = \frac{P (D | H) P (H)}{P (D)}

$P(H|D) = \frac{P(D|H)P(H)}{P(D)}$
先验概率：P(H)，在得到新数据前某一假设的概率
后验概率：P(H|D)，在看到新数据后，该假设的概率
似然度：P(D|H)，在该假设下得到这一数据的概率
标准化常量：P(D)，在任何假设下得到这一数据的概率

在贝叶斯问题中，最关键的是在给定条件中，哪个是先验、哪个是后入的条件。以垃圾邮件分类为例：

注意，以下推断有误。

一封邮件是垃圾邮件的概率为 A ，其中包含的文字信息概率为 B。根据推断可以得到，是先有了构成邮件的文字，才可以引出这封邮件是不是垃圾邮件的问题。因此，B 是先验概率，A 是标准化常量。

更正：
的确是这么个逻辑，文字➡️邮件➡️邮件性质，但是我们无法通过文字来判断这是不是垃圾邮件，因为判别依据单凭文字的无法产生的，因为原本一些毫无“负面“的文字信息组合起来可能就变成了“垃圾信息“。

因此，正确的逻辑是这样，邮件性质➡️统计不同文件的文字信息➡️根据这些文字信息判断新的邮件性质。

所以，垃圾邮件概率 A 是先验概率，而文字信息 B 是标准化常量、即支撑作判断的信息。

为了与上面的贝叶斯公式中的字符对上，也便于程序实现：

事件 H 视为垃圾邮件
事件 D 视为邮件中的文字信息
P(H|D) 是由 D 构成的文档是垃圾邮件概率
- P(H|d0) 是由非垃圾信息构成的邮件概率
- P(H|d1) 是由垃圾信息构成的邮件概率

在已打标签的邮件中，统计词频 ➡️ 建立“垃圾词“ 和 “非垃圾词“ 的词向量空间 ➡️ 录入新邮件文档 ➡️ 比较在两个向量空间中的概率 ➡️ 取概率最大类别

猜你喜欢

转载自blog.csdn.net/weixin_37392582/article/details/80447883

【机器学习实战】 Bayes

机器学习算法 --- Naive Bayes classifier

机器学习算法（伍）Naive Bayes 算法

机器学习实战（Machine Learning in Action）学习笔记————04.朴素贝叶斯分类（bayes）

机器学习实战（三）朴素贝叶斯NB（Naive Bayes）

机器学习实战：Python基于朴素贝叶斯Bayes进行分类预测（二）

【机器学习实战】利用朴素贝叶斯算法(naive_bayes)实现新闻分类

机器学习分类实例——SVM(修改)/Decision Tree/Naive Bayes

一机器学习之朴素贝叶斯（naive bayes）

【机器学习】朴素贝叶斯(Naive Bayes)

机器学习——朴素贝叶斯（Naive Bayes）详细解读

机器学习之朴素贝叶斯(Naive Bayes)

机器学习2：Naive Bayes（朴素贝叶斯）

我与机器学习 - [Today is Bayes] - [贝叶斯]

机器学习算法之_朴素贝叶斯（Bayes）

跟着Leo机器学习：sklearn之Naive Bayes

Python机器学习 — 朴素贝叶斯算法（Naive Bayes）

机器学习算法: 朴素贝叶斯(Naive Bayes)

机器学习之朴素贝叶斯（Naive Bayes）

Bayes分类器案例学习笔记

西瓜书+实战+吴恩达机器学习（八）监督学习之朴素贝叶斯 Naive Bayes

BAYES和朴素BAYES

Bayes文本分类算法案例学习笔记

统计学习-朴素贝叶斯算法（Naive Bayes）

机器学习分类实例(sklearn)——SVM(修改)/Decision Tree/Naive Bayes

机器学习算法1-朴素贝叶斯（Naive Bayes

机器学习笔记：朴素贝叶斯方法（Naive Bayes）原理和实现

Python机器学习算法 — 朴素贝叶斯算法（Naive Bayes）

机器学习---朴素贝叶斯分类器（Machine Learning Naive Bayes Classifier）

机器学习——分类算法3：朴素贝叶斯（Bayes）思想和代码解释

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)