数据挖掘学习|task4 建模调参 - 代码天地

数据挖掘学习|task4 建模调参

其他 2020-04-04 16:15:18 阅读次数: 0

线性回归模型：线性回归对于特征的要求；处理长尾分布；理解线性回归模型；

线性回归模型建立
通过对log(x+1)变换，使得长尾分布贴近于正态分布

模型性能验证：评价函数与目标函数；交叉验证方法；留一验证方法；针对时间序列问题的验证；绘制学习率曲线；绘制验证曲线；

#绘制学习率曲线与验证曲线
from sklearn.model_selection import learning_curve, validation_curve
? learning_curve

def plot_learning_curve(estimator, title, X, y, ylim=None, cv=None,n_jobs=1, train_size=np.linspace(.1, 1.0, 5 )):  
    plt.figure()  
    plt.title(title)  
    if ylim is not None:  
        plt.ylim(*ylim)  
    plt.xlabel('Training example')  
    plt.ylabel('score')  
    train_sizes, train_scores, test_scores = learning_curve(estimator, X, y, cv=cv, n_jobs=n_jobs, train_sizes=train_size, scoring = make_scorer(mean_absolute_error))  
    train_scores_mean = np.mean(train_scores, axis=1)  
    train_scores_std = np.std(train_scores, axis=1)  
    test_scores_mean = np.mean(test_scores, axis=1)  
    test_scores_std = np.std(test_scores, axis=1)  
    plt.grid()#区域  
    plt.fill_between(train_sizes, train_scores_mean - train_scores_std,  
                     train_scores_mean + train_scores_std, alpha=0.1,  
                     color="r")  
    plt.fill_between(train_sizes, test_scores_mean - test_scores_std,  
                     test_scores_mean + test_scores_std, alpha=0.1,  
                     color="g")  
    plt.plot(train_sizes, train_scores_mean, 'o-', color='r',  
             label="Training score")  
    plt.plot(train_sizes, test_scores_mean,'o-',color="g",  
             label="Cross-validation score")  
    plt.legend(loc="best")  
    return plt

在这里插入图片描述
4. 嵌入式特征选择： Lasso回归； Ridge回归；决策树；

6. 模型对比：常用线性模型；常用非线性模型；
7. 模型调参：贪心调参方法；网格调参方法；贝叶斯调参方法

布朗尼20200202

发布了5 篇原创文章 · 获赞 1 · 访问量 55

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_39294199/article/details/105251618

数据挖掘学习|task4 建模调参

Datawhale 零基础入门数据挖掘-Task4 建模调参

Datawhale零基础入门数据挖掘-Task4建模调参

Datawhale零基础入门数据挖掘-Task4建模调参

task4 建模与调参打卡

task4建模调参

Task4 建模调参

数据挖掘TASK4_建模调参

TASK 4 建模调参

零基础入门数据挖掘 Task4：调参建模

数据挖掘建模调参

数据挖掘——建模调参

《零基础入门数据挖掘 - 二手车交易价格预测》Task4:建模与调参

机器学习建模调参

task4——模型和调参

DatawhaleX天池二手车Task4:建模与调参

机器学习训练_Task4_建模调参

【我的数据挖掘竞赛之旅（二）】二手车交易价格预测——2020年天池阿里云竞赛Task4建模调参

金融风控 Task-04 4 建模与调参

天池&DataWhale：Task04：建模与调参

深度梳理：机器学习建模调参方法总结

二手车交易价格预测_Task4_建模与调参

二手车数据挖掘- 建模调参

数据挖掘实践（金融风控-贷款违约预测）（四）：建模与调参

#机器学习--第4章：建模调参之决策树与随机森林初体验

【机器学习】回归案例实践：数据处理建模调参

数据挖掘项目--调参

二手车交易价格预测----建模调参（4）

#机器学习--第3章：建模调参之支持向量机SVM初体验

零基础入门数据挖掘-二手车交易价格预测之建模调参

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)