随即森林C4.5思想

决策树C4.5算法,从1248个属性中选出18个分类属性,每一个属性里的每一个值a,通过<=a,>a把数据分成两个部分,然后计算每一部份的信息熵,计算这个属性值a的“信息增益“,然后得到这个属性最大信息增益的分类间隔数;求出所有18个属性的的信息增益和间隔后,求出最大“信息增益率“的属性,作为树根的分类属性。然后通过这个属性的这个分类间隔求出做子左和右子树,去掉最大信息增益率的属性,分别应用决策树算法。;依次迭代下去生成一颗树。

猜你喜欢

转载自blog.csdn.net/zpnkwxp2011/article/details/80700568