简明理解AdaBoost算法 - 代码天地

简明理解AdaBoost算法

其他 2019-06-28 00:30:17 阅读次数: 0

知识共享许可协议

版权声明：署名，允许他人基于本文进行创作，且必须基于与原先许可协议相同的许可协议分发本文（Creative Commons）

简明理解AdaBoost算法

从案例理解AdaBoost

(转载自李航《统计学习方法》,有删减)，使用AdaBoost算法学习如下训练数据，弱分类器采用sign()函数。

x	1	2	3	4	5	6	7	8	9
y	1	1	1	-1	-1	-1	1	1	1

解：
初始化数据权值分布，即 $m=0$
$D_1=(w_{11},w_{12},...,w_{110})$ $w_{1i}=0.1, \quad i=1,2,...,10$
对 $m=1$ :
(1) 基本分类器： $G_1(x)=-sign(x-2.5)$
(2) 误差率 $e_1=P(G_1(x_i) \neq y_i)=0.3$
(3) 计算 $G_1(x)$ 的系数： $\alpha_1 = \frac {1}{2}log{\frac{1-e_1}{e_1}}=0.4236$
(4) 更新权值分布：
$D_2(w_{21},w_{22},...,w_{210})$ $w_{2i}=\frac{w_{1i}}{Z_1}exp(-\alpha_1y_iG_1(x_i)), \quad i=1,2,...,10$ $f_1(x)=0.4236G_1(x)$ 分类器 $sign[f_1(x)]$ 在训练数据集上有3个误分类点。
对 $m=2,m=3$ 分别执行以上步骤： $G(x)=sign[0.4236G_1(x)+0.6496G_2(x)+0.7514G_3(x)]$

import numpy as np 
import matplotlib.pyplot as plt

x0 = [0,1,2,3,4,5,6,7,8,9]
y0 = [1,1,1,-1,-1,-1,1,1,1,-1]

x1 = np.linspace(-1,10,100)
G1 = -np.sign(x1-2.5) 
G2 = -np.sign(x1-8.5) 
G3 = np.sign(x1-5.5)

fig, axs = plt.subplots(2,2)

axs[0,0].scatter(x0,y0)
axs[0,0].plot(x1,G1)
axs[0, 0].set_title('f1(x)', fontsize=10)

axs[0,1].scatter(x0,y0)
axs[0,1].plot(x1,np.sign(0.4236*G1+G2))
axs[0,1].set_title('f2(x)', fontsize=10)

axs[1,0].scatter(x0,y0)
axs[1,0].plot(x1,np.sign(0.4236*G1+0.6496*G2+G3))
axs[1,0].set_title('f3(x)', fontsize=10)

axs[1,1].scatter(x0,y0)
axs[1,1].plot(x1,np.sign(0.4236*G1+0.6496*G2+0.7514*G3))
axs[1,1].set_title('f3(x)', fontsize=10)
fig.tight_layout()

plt.show()

在这里插入图片描述
最终通过sign分类的线性组合，逐步将训练误差减少到0

案例分析

针对二分类的提升（boosting）方法有两个步骤：
1、改变训练数据的权值或概率分布
2、将弱分类器组合为强分类器

涉及计算内容为：

计算$G_m(x)的系数：
$\alpha_m=\frac{1}{2}log{\frac{1-e_m}{e_m}}$
更新权重：
$D_{m+1}(w_{m+1,1},w_{m+1,2},...,w_{m+1,N})$ $w_{m+1,i}=\frac{w_{m,i}}{Z_m}exp(-\alpha_my_mG_m(x_i)), \quad i=1,2,...,N$ 其中， $Z_m$ 是规范化因子，有 $Z_m=\sum_{i=1}^{N}exp(-\alpha_my_mG_m(x_i))$
当正确分类时： $w_{m+1}=\frac{w_{mi}}{Z_m}e^{-\alpha_m}$ ，权值缩小
当错误分类时： $w_{m+1}=\frac{w_{mi}}{Z_m}e^{\alpha_m}$ ，权值放大

猜你喜欢

转载自blog.csdn.net/houhuipeng/article/details/92800689

简明理解AdaBoost算法

ADMM简明理解

简明理解变分

javascript事件代理的简明理解

简明理解微分差分导数

python——元组和字典类型简明理解

简明理解行列式和秩

Spring IOC，DI注入（依赖注入）最简明理解

Spring IOC，DI注入（依赖注入）最简明理解

Adaboost算法的初步理解

理解AdaBoost算法

AdaBoost算法的理解

简明理解三次握手和四次挥手

编译原理 NFA转换为等价DFA 子集法简明理解

最新AdaBoost算法原理与理解

深入理解Adaboost算法

adaboost算法原理实现及理解

Adaboost算法原理分析和实例+代码（简明易懂）

SVD实例说明理解

AdaBoost理解

Adaboost算法

AdaBoost 算法

【AdaBoost算法】

（十三）通俗易懂理解——Adaboost算法原理

AdaBoost分类算法小结

提升算法——Adaboost

AdaBoost 算法详解

Adaboost算法原理与实践

【机器学习】adaboost算法

AdaBoost算法的简单例子

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)