随机森林 Random Forest - 代码天地

随机森林 Random Forest

其他 2018-07-31 18:16:02 阅读次数: 0

随机森林是由决策树通过Bagging策略训练而成的，即：

B a g g i n g + D e c i s i o n T r e e = R a n d o m F o r e s t

$Bagging + Decision Tree = RandomForest$

随机森林的算法执行过程：
设有训练数据集 $S=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}$
其中 $x_i \in X \subseteq R^n$
弱学习器迭代次数 $T$
输出强学习器 $F(x)$

1、在第 $t,t=1,2,...,T$ 次随机取样中，采 $N$ 次样，得到包含 $N$ 个样本的采样集 $D_t$

2、将采样集 $D_t$ 使用CART方法训练第 $t$ 个弱学习器 $G_t(x)$

3、如果是分类算法预测，则 $T$ 个弱学习器投出最多票数的类别或者类别之一为最终类别；如果是回归算法，T个弱学习器得到的回归结果进行算术平均得到的值为最终模型输出。

随机森林算法的优缺点：

优点：

训练可以高度并行化，对于大样本训练有速度优势；
由于可以随机选择决策树节点划分特征，这样在样本特征维度很高的时候，仍然能高效的进行模型训练；
在训练后，可以给出各个特征对于输出的重要性；
由于采用了随机采样，训练出的模型的方差小，泛化能力强；
相对于Boosting系列的Adaboost和GBDT， RandomForest实现比较简单；
对部分特征缺失不敏感。

缺点：

在某些噪音比较大的样本集上，RF模型容易陷入过拟合；
取值划分比较多的特征容易对RF的决策产生更大的影响，从而影响拟合的模型的效果；
相对于基于决策树的Boosting的GBDT算法来说，想要达到一个比较好的效果，弱分类器的个数远高于GBDT，也就是说RandomForest模型在高维大数据集上训练出的模型太大。

猜你喜欢

转载自blog.csdn.net/baishuiniyaonulia/article/details/81040255

随机森林（Random Forest）

随机森林 Random Forest

【ML】随机森林（Random Forest）

MachineLearning—随机森林(Random Forest)

随机森林（Random Forest， RF）

随机森林Random Forest （RF）

机器学习（六）—随机森林Random Forest

随机森林(Random Forest)通俗教程

随机森林算法——Random Forest（RF）

[Machine Learning & Algorithm] 随机森林（Random Forest）

机器学习——随机森林（Random Forest）

集成学习与随机森林(Random Forest)详述

随机森林（Random Forest）入门与实战

随机森林（Random Forest）学习小记

随机森林（Random Forest）算法梳理

机器学习之random forest（随机森林）

机器学习 - 随机森林 Random Forest

机器学习算法-随机森林（Random Forest）

随机森林（Random Forest）简单介绍

随机森林（Random Forest）学习笔记

机器学习之随机森林（Random forest）

随机森林算法（Random Forest）Python实现

【机器学习】【随机森林-2】Random Forest算法的Python实现

Ensemble methods 之 Random Forest（随机森林)（收藏）

决策树（二）：随机森林（random forest）

随机森林算法及其实现（Random Forest）

R语言之Random Forest随机森林（转载）

3. 集成学习（Ensemble Learning）随机森林（Random Forest）

随机森林原理详解 random forest 代码+参数讲解

决策树系列（二）：随机森林(random forest)

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)