数据结构大作业之随机森林与XGBoost训练与调参 - 代码天地

数据结构大作业之随机森林与XGBoost训练与调参

其他 2020-08-11 11:16:13 阅读次数: 0

做什么：

模型训练；
调参训练；
训练，优化得到预测模型

首先基础内容：

课程链接
基本原理认识
基础概念知识：
（1）交叉验证
（2）随机森林，XGBoost，调参+学习曲线/网格搜索+解读调参结果和过程

课程基础：

sklearn：开源的基于python语言的机器学习工具包，几乎涵盖了大部分主流机器学习算法
随机森林：集成算法中的装袋法：一次性建立多个若评估器
Xgboost：集成算法中提升法的代表算法：梯度提升树

树模型：分类树，回归树
XGB：每个叶子结点上会有一个预测分数，也被称为叶子权重，即为求解的xgb最后的结果：参数模型。(每棵树之间相互递进的关系）
xgb的超参数：k棵树；silent：打印训练的结果：建树流程
简单建模：探索性质
（1）xdb，随机森林，线性回归对比
（2）学习曲线，进行优化

对比之随机森林

重点：

集成算法原理：非常具有代表性的bagging集成算法（装袋），所有基评估器是决策树
调参
步骤：
（1）建模流程
（2）随机森林参数：n_estimators调参重点，单调影响：越大随机森林精确性越好，建树越多——渴望找到训练难度和模型效果之间的平衡
（新版sklearn中把n_estimators=100）

（3）建一片随机森林与建一棵决策树对比：
森林的每一棵树长得是不一样的；
进行10组的10次交叉验证，进行验证——随机森林
（4）调参的探究（调参的办法：对模型的理解和调参思路）：
找目标：模型的评估指标：在测试集上准确率高，模型效果好（泛化误差小）
模型的泛化误差降低：首先判断模型在图像的那一边：“偏差方差困境”，模型复杂度与泛化误差的关联
模型太复杂，太简单-泛化误差都受影响，我们追求的是位于中间的平衡点
对树模型和树的集成模型来说，树的深度越深，叶子越多模型越复杂
树模型和树的集成模型的目标，都是减少模型复杂度，把模型往图像的左边移动
（5）树模型：在于剪枝，使最大限度调上去

对比XGBoost：

梯度提升算法：每个叶子结点上会有一个预测分数，也被称为叶子权重，即为求解的xgb最后的结果：参数模型。(每棵树之间相互递进的关系）
交叉验证，调参
训练最优模型，保存模型

保存模型，进行预测

前面训练的模型，进行保存
实现前端页面（输入），调用已经保存的模型，进行预测输出

猜你喜欢

转载自blog.csdn.net/qq_43642447/article/details/106505498

数据结构大作业之随机森林与XGBoost训练与调参

随机森林_调参

数据结构大作业

数据结构大作业之数据分析

随机森林在乳腺癌数据上的调参

实战：随机森林在乳腺癌数据上的调参

【XGboost调参】XGboost数据比赛实战之调参篇(完整流程)

数据结构大作业代写

sklearn随机森林调参小结

随机森林调参参考顺序

Python机器学习实践：随机森林算法训练及调参-附代码

机器学习之随机森林、GBDT、Xgboost

随机森林，xgboost, gbdt

数据结构-集成算法-随机森林

#机器学习--第4章：建模调参之决策树与随机森林初体验

数据结构大作业——基数排序

数据结构与算法课程设计大作业

天大《数据结构》大作业期末考核

数据结构大作业１：矩阵类的实现

数据结构大作业——树（和广义表）

数据结构大作业流程总结-答辩准备

数据结构实践大作业（城市网点建设）

数据结构大作业-班级考勤管理系统

sklearn 随机森林参数属性接口及在乳腺癌数据上的调参

【skLearn练习】随机森林调参应用 ---- 乳腺癌数据集

scikit-learn随机森林调参小结

【转】scikit-learn随机森林调参小结

【代码模版】随机森林调参思路及代码模版

Python随机森林调参红酒品质预测

python--随机森林建模3（调参）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)