- 连续值处理
之前讨论的决策树是属性的取值都是有限个数,都是离散的,对于连续值,需要使用离散化技术,最简单的就是使用二分法。
- 缺失值处理
我们可能会遇到样本的某些属性值缺失的情况,这时候我们需要对不完整样本进行处理。
这三个数值用来在信息增益中作为权重。
之前讨论的决策树是属性的取值都是有限个数,都是离散的,对于连续值,需要使用离散化技术,最简单的就是使用二分法。
我们可能会遇到样本的某些属性值缺失的情况,这时候我们需要对不完整样本进行处理。
这三个数值用来在信息增益中作为权重。