李航 《统计学习方法》习题8.1


解题:

因为题中假设弱分类器为决策树,可采用CART二叉分类树。

1、初始化数据权值分布:

D =  (w11, w12, ..., w110) = (0.1,0.1, ..., 0.1)

w1i  =0.1 ,i = 1,2,....,10

2、计算各特征的基尼系数(为计算方便,就取深度为1 的树):

根据基尼系数的计算公式:


求得:



gini(D,潜力=2)的基尼系数最小,所以第一个选潜力等于2 和非2 为划分点。

3、计算误差率,分类器的权重,更新的权重:

根据上面的划分可以知道3,6,8被误分类



则计算如下:



4、如此循环往复的重复步骤2,3,直到你的分类器上的误差为0 ,或者低于你的阈值的时候,就可以停止了。



ps:计算的正确性,我也不知道我计算正确没有,不过应该正确的抓狂

猜你喜欢

转载自blog.csdn.net/maymay_/article/details/80070188