xgboost输出特征重要性排名和权重值 - 代码天地

xgboost输出特征重要性排名和权重值

其他 2018-11-01 20:22:04 阅读次数: 0

在机器学习实践中，我们要经常用到xgboost框架去训练数据，然后用训练得到的模型再去预测其他未知的数据的标签。

在判断训练得到的模型是否合理时，一个很重要的步骤就是查看xgboost模型的特征重要性排序。如果观察得到模型的排名前几的特征都不符合我们正常的思维，那么模型很可能是不稳定或者有问题的。在训练得到模型文件及特征映射文件后，可以通过下面一段代码查看特征排名、特征名称、特征权重值

#-*-encoding: utf-8-*-


import xgboost as xgb
import pandas as pd
import operator
from matplotlib import pylab as plt
from pylab import *

fm = mpl.font_manager
fm.get_cachedir()
model_dir = 'your_model_directory_name/'
model_file = 'your_model_file_name'
fmap_file = 'your_fmap_file_name'
model =xgb.Booster(model_file=model_dir + model_file)


importance = model.get_fscore(fmap=model_dir + fmap_file)
f = open(model_dir + fmap_file)
fmap_dict = {}
for line in f:
    line = line.strip().split()
    fmap_dict[line[1]] = line[0]
feature_num = 10 #想要查看top10的特征名称及权重，这里设置想要查看前多少个特征及其权重
importance = sorted(importance.items(), key=operator.itemgetter(1), reverse=True)
importance = importance[:feature_num]
index = 1
print '特征排名', '特征名称', '特征权重值'
for line in importance:
    print index, fmap_dict[str(line[0])[1:]], line[1]
    index += 1

猜你喜欢

转载自blog.csdn.net/oppo62258801/article/details/81212854

xgboost输出特征重要性排名和权重值

xgboost 特征重要性计算

XGBoost学习（六）：输出特征重要性以及筛选特征

XGBoost 中特征重要性和特征选择原理解析与实战

用xgboost模型对特征重要性进行排序

决策树、RF、xgboost如何处理缺失值？判断特征重要性？缺失值不敏感？

xgboost 特征重要性选择 / 看所有特征哪个重要

Python中XGBoost的特性重要性和特性选择

特征重要性分析

集成学习,xgboost.plot_importance 特征重要性（示例）

随机森林的特征重要性原理

sklearn:特征与树木森林的重要性

模型融合---特征重要性评估

特征重要性--feature_importance

机器学习特征重要性分析

特征选择 | 变量重要性衡量

xgboost 设定每条数据的重要性

函数返回值的重要性

基于随机森林做回归任务（数据预处理、MAPE指标评估、可视化展示、特征重要性、预测和实际值差异显示图）

交易因子对月度收益的重要性排名

sklearn 可视化模型的训练测试收敛情况和特征重要性

使用XGboost模块XGBClassifier、plot_importance来做特征重要性排序——修改f1,f2等字段

随机深林-特征重要性计算方式

ML12:特征重要性选取

pyspark 随机森林特征重要性

【代码模版】特征重要性评估模版

随机森林是否需要交叉验证+特征的重要性

如何用Python计算特征重要性？

特征选择对于机器学习重要性

利用随机森林对特征重要性进行评估

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)