连续值与缺失值

  • 连续值处理         

         之前讨论的决策树是属性的取值都是有限个数,都是离散的,对于连续值,需要使用离散化技术,最简单的就是使用二分法。

 

  • 缺失值处理

我们可能会遇到样本的某些属性值缺失的情况,这时候我们需要对不完整样本进行处理。

 

这三个数值用来在信息增益中作为权重。

 

猜你喜欢

转载自blog.csdn.net/whimewcm/article/details/83177102