版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_36890813/article/details/89071836
一、什么是C4.5算法
C4.5算法是优化的ID3算法(什么是ID3算法)。优化点在:ID3要求每个分支点的比例相同。但是举例例子,每个人居住的城市不同,数据中某个城市的人数较多,这就会影响决策树生成。
解决办法
- 把城市上升一个等级,比如省份、华南华北、南方北方
- C4.5做法是算信息增益率。
二、举个列子
这里算水生动物的信息增利率