"朴素"由来
朴素贝叶斯(Naive Bayes)方法是一组监督学习算法,它基于贝叶斯定理,“天真地”“朴素”地假设特征之间互相独立,即一个特征的存在与其他特征的存在无关。这也是“朴素”“Naive”一词的缘由。
贝叶斯定律及案例:https://blog.csdn.net/houhuipeng/article/details/90706539
样本
属于类别
的概率为:
当满足
为
的
例的概率大于
例时,可以确定
属于
假设特征互相独立,则
最终可得:
优缺点分析
朴素贝叶斯模型是一组极其快速和简单的分类算法,通常适用于非常高维的数据集。因为它们如此之快并且可调参数很少,所以它们最终作为分类问题的快速基础非常有用。
优点:运算速度快,模型简单可调参数少。
缺点:前提假设大多数情况下不成立。
根据假设特征分布的不同,可分为:
- 高斯朴素贝叶斯
- 多项式朴素贝叶斯
- 补充朴素贝叶斯
- 伯努利朴素贝叶斯
参加sklearn官方文档:
https://scikit-learn.org/stable/modules/naive_bayes.html