【数据分析案例】从XGBoost算法开始，更好地理解和改进你的模型 - 代码天地

【数据分析案例】从XGBoost算法开始，更好地理解和改进你的模型

其他 2018-07-04 16:53:44 阅读次数: 0

案例来源：@将门创投

案例地址： https://mp.weixin.qq.com/s/oeetxWMM3cr1BgvIaGU54A

1. 目标：使用xgb评估客户的信贷风险时，还希望得出揭示

2. xgb全局特征重要性度量

1）weight：根据特征用于划分的次数

2）cover：根据特征用于划分的次数和每次划分的样本数加权计算得来

3）gain：特征用于划分时所带来的训练损失减益的平均值

3. 评价特征度量的原因

1）一致性：如果我们队模型进行修改，使其更依赖于某个特征A的话，那么特征A的特征重要性不应当降低

2）准确性：所有特征重要性的和要等于模型的总重要性。例如，如果重要性是由R²值计算得到的，那么各个特征的R²值相加应等于模型的R²值

4. 局部特征归因方法（对每个客户的预测提供解释）

1）Tree SHAP

2）Saabas

3）mean Tree SHAP

4）Gain：特征用于划分时所带来的训练损失减益的平均值

5）Split Count：特征用户划分的次数

6）Permutation：当随机扰动某个特征时，模型在测试集上准确率的下降（可以是OOB数据，参林轩田《机器学习技法》课）

5. 测试结论：

1）均不一致

2）Gain和Permutation是不准确的

3）通常来说离根越近的节点分裂越重要，但是gain方法中低层叶节点分裂的贡献更大

4）mean Tree SHAP效果好（还没找到文献...不知道怎么用...大家有了解的麻烦告知下...树模型的可解释性可以帮助更好地理解模型，反过来构建特征）

猜你喜欢

转载自blog.csdn.net/u013382288/article/details/80838732

【数据分析案例】从XGBoost算法开始，更好地理解和改进你的模型

数据分析之GBDT，XGBOOST模型

如何更好地理解和掌握 KMP 算法

数据分析利器：XGBoost算法最佳解析

通过案例理解数据分析

LangChain Prompt Engineering和LLMs：如何让语言模型更好地理解和生成文本

Python在地理数据分析和可视化的概览

【数据分析实战】利用python数据清洗后基于机器学习(GBDT和Xgboost算法)对房价预测

【转载】套路----让你更好地理解动态规划

自学数据分析——数据分析方法和模型

学好数据分析，从掌握KSA模型开始

数据分析案例

数据分析模型

商业分析与数据分析、算法模型的关系与区别

【数据分析案例】如何定义你的“亲密关系”

深度学习驱动的地理数据分析：使用K-means算法

数据分析与预测模型：人工智能如何帮助营销团队更好地预测市场趋势和预测营销效果

开始学数据分析

ML之XGBoost：基于泰坦尼克号数据集(填充/标签编码/推理数据再处理)利用XGBoost算法(json文件的模型导出和载入推理)实现二分类预测应用案例

数据分析之优化算法与模型持久化

excel数据分析案例

网站数据分析案例

民航数据分析_案例

Xgboost算法——Kaggle案例

练就分析思维，成为更好的数据分析师

[深度学习]更好地理解正则化：可视化模型权重分布

想要更好地理解大模型架构？从计算参数量快速入手

如何更好的理解和掌握 KMP 算法?

数据分析从零开始实战，Pandas读取HTML页面+数据处理解析

8 张图助你更好地理解 Java 编程(转)

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)