【机器学习】--集成算法从初始到应用 - 代码天地

【机器学习】--集成算法从初始到应用

其他 2018-06-22 08:24:46 阅读次数: 3

一、前述

集成思想就是让很多个训练器决定一个结果，目的：让机器学习效果更好，单个不行，群殴走起。

二、具体

1、概述

2、Bagging模型

全称： bootstrap aggregation（说白了就是并行训练一堆分类器），最典型的代表就是随机森林啦。

随机：数据采样随机，特征选择随机

森林：很多个决策树并行放在一起

构造树模型：

由于二重随机性，使得每个树基本上都不会一样，最终的结果也会不一样。

树模型：之所以要进行随机，是要保证泛化能力，如果树都一样，那就没意义了！

随机森林优势：
它能够处理很高维度（feature很多）的数据，并且不用做特征选择
容易做成并行化方法，速度比较快
在训练完后，它能够给出哪些feature比较重要
可以进行可视化展示，便于分析

理论上越多的树效果会越好，但实际上基本超过一定数量就差不多上下浮动了

3、Boosting模型

典型代表：AdaBoost， Xgboost
Adaboost会根据前一次的分类效果调整数据权重
最终的结果：每个分类器根据自身的准确性来确定各自的权重，再合体
解释：如果某一个数据在这次分错了，那么在下一次我就会给它更大的权重

Adaboost工作流程
每一次切一刀！
集成算法
最终合在一起
弱分类器这就升级了！

4、Stacking模型
堆叠：很暴力，拿来一堆直接上（各种分类器都来了）
可以堆叠各种各样的分类器（KNN,SVM,RF等等）
为了刷结果，不择手段！
分阶段：第一阶段得出各自结果，第二阶段再用前一阶段结果训练

堆叠在一起确实能使得准确率提升，但是速度是个问题
集成算法是竞赛与论文神器，当我们更关注于结果时不妨来试试！

猜你喜欢

转载自www.cnblogs.com/LHWorldBlog/p/9211626.html

【机器学习】--集成算法从初始到应用

机器学习——集成算法

机器学习：集成算法

机器学习算法——集成算法（一）

机器学习原理 || 集成算法: Adaboost

机器学习集成算法：XGBoost思想

机器学习概念----集成算法

机器学习集成算法总结

机器学习：集成算法 - GBDT

【机器学习】集成算法与随机森林

机器学习9：集成算法

机器学习：集成算法概述

【机器学习】集成算法与实战案例

机器学习集成算法AdaBoost算法_20201231

数据分析与机器学习学习笔记--集成算法

机器学习（六）：集成算法（1）Bagging

机器学习集成算法XGBoost原理及推导

机器学习集成算法：XGBoost模型构造

机器学习入门-集成算法(bagging, boosting, stacking)

机器学习：集成算法 - bagging、boosting、adaboost

机器学习集成算法GBDT_20210111

【机器学习】集成算法:bagging策略包含详细案例

集成算法——学习笔记

传统机器学习(六)集成算法(2)—Adaboost算法原理

传统机器学习(六)集成算法(1)—随机森林算法及案例详解

【机器学习算法】三、集成算法：RF、AdaBoost、GBDT、XGBoost、LightGBM、Stacking模型融合

【机器学习篇】--SVD从初始到应用

【机器学习】--SVM从初始到应用

Python机器学习入门 - - 随机森林集成算法学习笔记

集成算法学习笔记（一）

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)