信息增益的计算

信息增益有的也成为信息获取量(Information Gain)。
这里主要介绍在决策树中的使用。
G a i n ( A ) = I n f o r ( D ) I n f o r _ A ( D )
这里写图片描述
这里以特征A为例,特征A的信息增益计算方式如下:

  • 计算整个信息(就是计算是否买电脑)的熵:
    I n f o r ( D ) = ( 9 14 log 2 ( 9 14 ) + 5 14 log 2 ( 5 14 ) ) = 0.94 b i t s
  • 计算依照年龄分类时购买电脑的熵:
    I n f o r a g e ( D ) = 5 14 × ( 2 5 log 2 2 5 3 5 log 2 3 5 ) + + 5 14 ( 3 5 log 2 3 5 2 5 log 2 2 5 ) = 0.694 b i t s
  • 按照公式计算:
    G a i n ( a g e ) = I n f o r ( D ) I n f o r a g e ( D ) = 0.94 0.694 = 0.246 b i t s

猜你喜欢

转载自blog.csdn.net/meiqi0538/article/details/80535054