sklearn之贝叶斯分类器使用 - 代码天地

sklearn之贝叶斯分类器使用

其他 2018-10-15 12:21:21 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/lzw2016/article/details/83048686

贝叶斯分类器

原理：基于先验概率P(Y)，利用贝叶斯公式计算后验概率P(Y/X)（该对象属于某一类的概率），选择具有最大后验概率的类作为该对象所属类

特点：数据可离散可连续；对数据缺失、噪音不敏感；若属性相关性小，分类效果好，相关也不低于决策树

朴素贝叶斯算法

学习的内容是先验概率和条件概率（都使用极大似然估计这两种概率），公式很难敲，不敲了

scikit-learn中根据条件概率不同的分布有多种贝叶斯分类器

高斯贝叶斯分类器（GaussianNB）【假设条件分布满足高斯分布】

sklearn.naive_bayes.GaussianNB

无参数，不需要调参
方法
- fit()
- partial_fit()：追加训练模型，适用于规模大的数据集，划分为若干个小数据集，在这些小数据集上连续使用partial_fit训练模型
- predict()
- score()
属性
- class_prior_：每个类别的概率
- class_count_：每个类别包含样本数量

多项式贝叶斯分类器（MultinomialNB）【。。。多项式分布】

sklearn.naive_bayes.MutlnomialNB

参数
- alpha：浮点数，指定朴素贝叶斯估计公式中λ值
- fit_prior=True：是否学习P(y=Ck)，不学习则以均匀分布替代
- class_prior=None：可以传入数组指定每个分类的先验概率，None代表从数据集中学习先验概率
- class_count：数组，形状为(n_class,)，每个类别包含训练样本数量
- feature_count：数组，形状(n_class,n_features)，每个类别每个特征遇到的样本数
方法同上面高斯贝叶斯

伯努利贝叶斯分类器（BernoulliNB）【。。。二项分布】

适用于离散特征
特征取值只能是0和1（如文本分类中某个词出现，特征为1；无，特征为0）

sklearn.naive_bayes.BernoulliNB

参数
- alpha：浮点数，指定贝叶斯估计中的λ
- binarize=0.0：浮点数或None，None表明原始数据已二元化；浮点数作为边界，特征取值大于该边界作为1，否则作为0（通过这个浮点数来实现二元化）
- fit_prior=True：是否学习P(y=Ck)，不学习则以均匀分布替代
- class_prior=None：可以传入数组指定每个分类的先验概率，None代表从数据集中学习先验概率
- class_count：数组，形状为(n_class,)，每个类别包含训练样本数量
- feature_count：数组，形状(n_class,n_features)，每个类别每个特征遇到的样本数
方法同上

alpha对预测的影响，越大(>100)准确率反而下降

binarize不能过小不能太大，一般取所有特征的所有值的(Min+Max)/2

猜你喜欢

转载自blog.csdn.net/lzw2016/article/details/83048686

sklearn之贝叶斯分类器使用

使用sklearn实现朴素贝叶斯分类器

使用Sklearn构建朴素贝叶斯分类器-新闻分类

sklearn库学习之朴素贝叶斯分类器

[译] Sklearn 中的朴素贝叶斯分类器

机器学习之朴素贝叶斯分类器

使用mapreduce用贝叶斯分类器训练

OpenCV之级联分类器训练与使用(二) Haar与LBP级联分类器使用

python机器学习之使用sklearn库进行图片、文本的分类（附带sklearn安装资源与教程）

【Sklearn】入门花卉数据集实验--理解朴素贝叶斯分类器

情感分析方法之snownlp和贝叶斯分类器（三）

机器学习笔记之（2）——贝叶斯分类器

机器学习之伯努利贝叶斯分类器bernoulliNB

机器学习算法脉络梳理之贝叶斯分类器

使用贝叶斯分类器从个人广告中获取区域倾向

朴素贝叶斯分类器

贝叶斯分类器

贝叶斯分类器（二）

贝叶斯分类器（一）

贝叶斯分类器函数

四、贝叶斯分类器

贝叶斯分类器详解

sklearn学习笔记之knn分类算法

sklearn学习之贝叶斯分类

Sklearn之支持向量机分类

Python之Sklearn笔记——分类树

机器学习之XGBoost分类器XGBClassifier-- xgb使用sklearn接口

Docker之容器使用

使用sklearn实现svm分类任务

使用sklearn实现随机森林分类

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)