西瓜书读书笔记(四)-决策树

全部笔记的汇总贴:《机器学习》西瓜书-读书笔记汇总贴

可以先看看这个:统计学习方法读书笔记(五)-决策树

一、基本流程

决策树(decision tree)是一类常见的机器学习方法。

二、划分选择

通过信息增益或信息增益率,还有就是基尼系数,具体的过程在上面链接里那篇文章讲的很详细。

三、剪枝处理

上面链接里那篇文章讲的很详细。

四、连续与缺失值

连续值:采用二分法对连续的属性进行处理,这也是C4.5决策树算法采用的机制。

缺失值:通过计算信息增益,让同一样本以不同的概率划入到不同的子节点中去。

五、多变量决策树

相当于是一个多分类的问题,即对同一属性进行划分的时候,不再是二分类而是进行多个分类以找到性能最好的决策树,不再是为每个非叶节点寻找到一个最优的划分属性。

下一章传送门:西瓜书读书笔记(五)-神经网络

猜你喜欢

转载自blog.csdn.net/qq_41485273/article/details/112793934
今日推荐