机器学习之路： python 实践提升树 XGBoost 分类器 - 代码天地

机器学习之路： python 实践提升树 XGBoost 分类器

其他 2018-05-08 16:57:03 阅读次数: 3

git: https://github.com/linyi0604/MachineLearning

数据集被我下载到本地，可以去我的git上拿数据集

XGBoost
提升分类器
属于集成学习模型
把成百上千个分类准确率较低的树模型组合起来
不断迭代,每次迭代生成一颗新的树

下面对泰坦尼克遇难预测
使用XGBoost模型和其他分类器性能进行比较

 1 import pandas as pd
 2 from sklearn.cross_validation import train_test_split
 3 from sklearn.feature_extraction import DictVectorizer
 4 from sklearn.ensemble import RandomForestClassifier
 5 from xgboost import XGBClassifier
 6 
 7 '''
 8 XGBoost
 9 提升分类器
10     属于集成学习模型
11     把成百上千个分类准确率较低的树模型组合起来
12     不断迭代,每次迭代生成一颗新的树
13     
14     
15 下面 对泰坦尼克遇难预测
16 使用XGBoost模型 和 其他分类器性能进行比较
17 
18 '''
19 
20 titanic = pd.read_csv("../data/titanic/titanic.txt")
21 # 抽取pclass age 和 sex 作为训练样本
22 x = titanic[["pclass", "age", "sex"]]
23 y = titanic["survived"]
24 # 采集的age空的用平均数补全
25 x["age"].fillna(x["age"].mean(), inplace=True)
26 
27 # 分割训练数据和测试数据
28 x_train, x_test, y_train, y_test = train_test_split(x,
29                                                     y,
30                                                     test_size=0.25,
31                                                     random_state=33)
32 # 提取字典特征 进行 向量化
33 vec = DictVectorizer()
34 x_train = vec.fit_transform(x_train.to_dict(orient="record"))
35 x_test = vec.transform(x_test.to_dict(orient="record"))
36 
37 # 采用默认配置的随机森林进行预测
38 rfc = RandomForestClassifier()
39 rfc.fit(x_train, y_train)
40 print("随机森林预测准确率:", rfc.score(x_test, y_test))  # 0.7811550151975684
41 
42 # 采用XGBoost模型进行预测
43 xgbc = XGBClassifier()
44 xgbc.fit(x_train, y_train)
45 print("XGBoost预测准确率:", xgbc.score(x_test, y_test))  # 0.7872340425531915

猜你喜欢

转载自www.cnblogs.com/Lin-Yi/p/9009271.html

机器学习之路： python 实践提升树 XGBoost 分类器

（二）提升树模型：Xgboost原理与实践

极端提升树XGBoost及其实践

Python3机器学习实践：集成学习之XGBoost

机器学习 | Python实现XGBoost极限梯度提升树模型答疑

机器学习之路：python 综合分类器随机森林分类梯度提升决策树分类泰坦尼克号幸存者

python机器学习库xgboost——xgboost算法（有分类和回归实例）

机器学习 - 提升树（下）- XGBoost 以及与 GBDT 的比较

机器学习 GBDT+xgboost 决策树提升

【机器学习】MATLAB实现XGBoost极限梯度提升树模型

机器学习笔记12-----XGBoost实践

【机器学习】 LightGBM——优于XGBoost提升的集成算法（安装+对比XGBoost改进+参数说明+python代码实例）

【进阶版】机器学习分类算法之XGBoost（集成学习算法）、LightGBM（梯度提升框架）（13）

xgboost ：提升树

集成学习 Adaboost 提升树 GBDT Xgboost Blending Stacking

使用XGBoost实现多分类预测的实践

机器学习-树模型（Boosting）相关问题：极限梯度提升树XGBoost

XGBoost 分类模型的Python实现

python-XGBoost应用（分类）

吴裕雄 python 机器学习——集成学习梯度提升决策树GradientBoostingClassifier分类模型

集成学习——Boosting之提升树（Boosting tree）、梯度提升树（GBDT）、XGBoost

XGBoost——机器学习（理论+图解+python代码）

Python机器学习笔记：XgBoost算法

机器学习-决策树（XGBoost、LightGBM）

机器学习2-python基础综合实践-线性逻辑斯蒂回归分类器

XGBoost算法应用入门学习实践

sklearn学习之XGBoost算法实践

我的XGBoost学习经历及动手实践

Python3《机器学习实战》学习笔记（十）：提升分类器性能利器-AdaBoost

机器学习之路：python线性回归分类器进行良恶性肿瘤分类预测

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)