上篇介绍了朴素贝叶斯分类器,之所以称为朴素,是因为它有一个重要假设:属性条件独立性假设,即假设所有属性相互独立。而现实任务中很难满足这个假设。所以有人就尝试对属性条件独立性假设做出一定的放松,于是就产生了“半朴素贝叶斯分类器”。
假设每个属性最多仅依赖一个其他属性:
问题转变为确定每个属性的依赖的属性(父属性)。
SPODE方法:假设所有的属性都依赖同一个属性,称为“
超父”,可以通过
模型选择的一些方法确定超父属性。下图中x1作为“超父”:
AODE方法:把每个属性作为“超父”来构建SPODE,然后将有足够训练数据的SPODE集成起来作为最终结果:
拉普拉斯修正后的概率:
通过以上两种常用的方法,我们就可以得到半朴素贝叶斯分类器。
参考资料:周志华《机器学习》
相关博文:朴素贝叶斯分类器