机器学习入门(八):分类算法——随机森林算法

学习目录:
在这里插入图片描述
随机森林算法目录
在这里插入图片描述

为什么使用随机森林?

当决策树产生过拟合时,可以使用随机森林算法优化

一.集成学习

      集成学习是通过建立几个模型组合来解决单一预测问题
原理:生成多个分类器/模型,各自独立学习和做预测,然后将他们的预测结合成组合预测

二.什么是随机森林

      随机森林是包含多个决策树的分类器,每个决策树都会输出预测类别,随机森林取树中结果出现最多的内个作为预测类别

三.随机森林训练原理

在这里插入图片描述
在这里插入图片描述

四.API

在这里插入图片描述

五.随机森林对泰坦尼克号乘客生存预测

在这里插入图片描述

六.总结

      随机森林能够有效地运行在大数据集上,能够处理高维特征的输入样本(它内部会进行特征降维),准确率也较高

分类算法总结:
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_45234219/article/details/115016806
今日推荐