决策树与分类算法之C4.5

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_36890813/article/details/89071836

一、什么是C4.5算法

C4.5算法是优化的ID3算法(什么是ID3算法)。优化点在:ID3要求每个分支点的比例相同。但是举例例子,每个人居住的城市不同,数据中某个城市的人数较多,这就会影响决策树生成。
解决办法

  • 把城市上升一个等级,比如省份、华南华北、南方北方
  • C4.5做法是算信息增益率。
    在这里插入图片描述

二、举个列子

在这里插入图片描述
这里算水生动物的信息增利率
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_36890813/article/details/89071836