IV值区间与预测能力关系

IV值区间与预测能力关系

IV值的全称是information value,中文的就是信息量或信息值,其主要作用就是当我们在用决策树或逻辑回归构建分类模型时对变量进行筛选。IV值就是衡量自变量的预测能力的大小,与其相似的还有信息增益、基尼系数等。

计算方式:

IV值区间与预测能力关系:

但是IV不是越高越好的,当IV>1.2时候,可能分箱不好或者存在因果倒置关系

猜你喜欢

转载自blog.csdn.net/LuYi_WeiLin/article/details/86575075
IV