简单粗暴理解与实现机器学习之集成学习(一):集成学习算法简介、机器学习的两个核心任务、集成学习中boosting和Bagging

集成学习

学习目标

  • 了解集成学习中主要解决的两个核心任务
  • 知道bagging集成原理
  • 知道随机森林决策树的建立过程
  • 知道为什么需要随机有放回(Bootstrap)的抽样
  • 应用RandomForestClassifie实现随机森林算法
  • 知道boosting集成原理
  • 知道bagging和boosting的区别
  • 了解gbdt实现过程
    在这里插入图片描述

5.1 集成学习算法简介

1 什么是集成学习

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FUywK5ZD-1583250286371)(../images/ensemble1.png)]

集成学习通过建立几个模型来解决单一预测问题。它的工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成组合预测,因此优于任何一个单分类的做出预测。

2 复习:机器学习的两个核心任务

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dnD9oIGI-1583250286372)(../images/ensemble2.png)]

3 集成学习中boosting和Bagging

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1NgqFpid-1583250286372)(../images/ensemble3.png)]

只要单分类器的表现不太差,集成学习的结果总是要好于单分类器的.

发布了627 篇原创文章 · 获赞 839 · 访问量 11万+

猜你喜欢

转载自blog.csdn.net/qq_35456045/article/details/104644870
今日推荐