机器学习_论文笔记_2: bagging predictors （ BREIMAN[1996]） - 代码天地

机器学习_论文笔记_2: bagging predictors （ BREIMAN[1996]）

其他 2018-12-17 02:30:30 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载 https://blog.csdn.net/u011467621/article/details/48267247

By joey周琦

Bagging predictor可以产生多个版本的predictor, 并把这些predictor聚集(aggregate)为一个。这种策略对于不稳定的系统可以提高其精度。

有一个学习数据集 $L$ ，包含数据 ${(y_n,x_n),n=1,\dots,N}$ ,其中 $x$ 为输入向量， $y$ 或者为一个类（分类问题）或者数值（回归问题）。我们可以从数据集 $L$ 中学到一个predictor $\varphi(x,L)$ .

假设现在我们有一系列数据集合 ${L_k}$ , 每个集合都有 $N$ 个训练数据，并且都来自与数据集 $L$ 相同的概率分布。那么明显我们可以得到一系列的predictor $\varphi(x,L_k)$ . 如何利用 ${L_k}$ 来得到一个比”单一数据集 $L$ 得到的predictor”更好的predictor呢？

对于回归问题：

φ A (x) = E L k φ (x, L k)

$\varphi_A(x) = E_{L_k}\varphi(x,L_k)$
对于分类问题，通过投票选择出初测最多的那个。

但是一般情况下，我们只有一个数据集 $L$ , 如何得到一些列的数据集 $L_k$ 并且和 $L$ 服从相同分布呢？利用bootstrap 从 $L$ 进行有放回的采样(random sampling with replace ment)的到一些列数据集 ${L^B}$ ,再通过上面的方法聚集出一个预测器. 我们称这个过程为”bootstrap aggregating”,组合起来就称为”bagging”

bagging可以提高“不稳定的算法”精度
- 这里的不稳定表示，数据集 $L$ 小幅度的改变，就可能大幅度改变predictor $\varphi(x,L)$ .(详见Breiman[1994])
- 不稳定的算法有神经网络，分类树，回归树等
- 稳定的算法有KNN
bagging可能会降低“稳定算法”的精度
bagging可以减少variance, 但是会小幅度提高bias

猜你喜欢

转载自blog.csdn.net/u011467621/article/details/48267247

机器学习_论文笔记_2: bagging predictors （ BREIMAN[1996]）

论文：Detecting and Correcting for Label Shift with Black Box Predictors（BBSE）

集成学习：Boosting与Bagging

集成学习——Bagging

集成学习—Boosting、Bagging

集成学习---(Bagging) RandomForest

集成学习 - Bagging

[机器学习] 集成学习 bagging

Bagging

【机器学习算法】bagging算法

机器学习技法------Blending and Bagging

机器学习技法笔记7：blending and bagging

机器学习技法笔记：07 Blending and Bagging

【论文】360-aware saliency estimation with conventional image saliency predictors阅读笔记

【论文阅读】Slope One Predictors for Online Rating-Based Collaborative Filtering

集成学习1——bagging与RF

集成学习Bagging与随机森林

集成学习-bagging，boosting介绍

集成学习boosting和bagging

[机器学习]集成学习--bagging、boosting、stacking

机器学习：集成学习（Bagging、Pasting）

机器学习之集成学习--Bagging

slope one predictors

机器学习系列-Bagging与随机森林

机器学习中Bagging和Boosting的区别

机器学习（八）：Bagging与随机森林

机器学习：Bagging和Boosting算法比较

图解机器学习-bagging-boosting

图解机器学习-剪枝分类-bagging

机器学习之boosting和bagging

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)