机器学习笔记2 －－贝叶斯分类 - 代码天地

机器学习笔记2 －－贝叶斯分类

其他 2018-07-15 17:38:35 阅读次数: 0

问题域

分类VS回归

前者是预测一个标签（类型、类别）；后者则是预测一个量。分类模型输出的预测值是离散值；而回归模型输出的预测值则是连续值。

模型函数

贝叶斯准则:“后验概率和先验概率的关系

条件独立性假设

实际情况下影响B的因素有n个，假设为b1~bn。则有

根据链式法则有

假设b1到bn这些特征之间在概率分布上是条件独立的，即每个特征和其它特征均不相关。则有

b1~bn为Feature，A为Class，上式可以改写为

目标函数

上述推导还存在一个隐含的假设，即未被观察到的部分出现概率为0，简单的将频率当做了概率。

这显然是不合理的，实际通常会使用某特征在数据样本中的分布来计算该特征的条件概率。

假设第i个的条件概率P（Xi|C）符合特定的形式（高斯分布），那么P（Xi|C）被参数θc,i（均值μ和方差σ）唯一确定。目标就是通过训练集得到参数θc,i，也就获得了对应特征的具体概率分布函数。将Xi的值带入即可求得条件概率P（Xi|C）。

参数估计方法-- 极大似然估计 (Maximum Likelihood Estimation, MLE)

似然指某种事件发生的可能性，它和概率的区别在于：概率用在已知参数的情况下，用来预测后续观测所得到的结果。似然则用于参数未知，但某些观测所得结果已知的情况，用来对参数进行估计。

参数θc,i的似然函数记作：

它表示在类别为c的所有样本在第i个特征上的联合概率分布。

极大似然估计就是寻找让似然函数取值达到最大的参数的估计方法。

详参 http://blog.csdn.net/zengxiantao1994/article/details/72787849

优化算法

为便于计算，对上试取对数，得到θc,i的对数似然：

因为自然对数 log 是一个连续且在似然函数的值域内严格递增的上凸函数。所以我们对似然函数求导，然后在设定导函数为0的情况下，求取 θc,i 的最大值。

优缺点

优点：接受大量数据训练和查询时所具备的高速度，支持增量式训练；对分类器实际学习的解释相对简单

缺点：无法处理基于特征组合所产生的变化结果

附：不用公式介绍贝叶斯决策论

http://blog.sina.com.cn/s/blog_3d2600e20102w21t.html

猜你喜欢

转载自blog.csdn.net/zjl0105/article/details/81024254

机器学习笔记2 －－贝叶斯分类

机器学习-朴素贝叶斯分类

机器学习 - 贝叶斯分类算法

机器学习之贝叶斯分类

机器学习--模型分类--贝叶斯

机器学习——朴素贝叶斯分类

机器学习学习笔记朴素贝叶斯分类笔记

机器学期——贝叶斯分类实战

朴素贝叶斯分类--笔记

朴素贝叶斯方法的学习与分类

sklearn学习之贝叶斯分类

机器学习笔记3——朴素贝叶斯算法（分类）

机器学习实战笔记：朴素贝叶斯分类

机器学习入门笔记（四）：朴素贝叶斯分类

机器学习（三）：概率学习——朴素贝叶斯分类

朴素贝叶斯分类算法——机器学习

机器学习实战---朴素贝叶斯分类方法

机器学习之朴素贝叶斯分类算法

机器学习——朴素贝叶斯分类实践

机器学习系列--贝叶斯分类算法

机器学习之贝叶斯算法图像分类

【机器学习】朴素贝叶斯-对文档进行分类

机器学习之朴素贝叶斯分类方法

机器学习-贝叶斯新闻分类实例

机器学习分类算法之朴素贝叶斯

机器学习算法--朴素贝叶斯分类

机器学习--朴素贝叶斯分类函数

机器学习sklearn（7）朴素贝叶斯分类

机器学习经典算法之朴素贝叶斯分类

机器学习-文本分类实例-朴素贝叶斯

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)