天池AI大赛智能制造预测赛题 - 代码天地

天池AI大赛智能制造预测赛题

企业开发 2018-04-17 13:10:20 阅读次数: 4

一、赛题与要求的简单介绍（多特征少样本问题）

本次比赛提供的是生产线上不同工序的生产数据（具体代表什么含义未可知），通过这些数据构建特征，设计模型，预测与之对应的生产数值。评判标准采用MSE，计算单个样本预测值与真实值的差距，再对所有样本进行MSE求和，最后取平均作为评判标准。

二、数据描述

数据包括ID列、工具列和数据列，他们有自己的命名格式。数据从形式上主要按照工具列标识分为十三组。每两个工具列之间的数据为一道工序。因为数据列与特征列Y经过脱敏处理，所以具体含义也无从知晓。每一数据列的并不是按照明显的时间顺序排列的，所以工序内数据列的顺序为随机的。部分数据存在大量缺失值，并且也有很多列仅有一个值，同时也有很多列完全重复。

在每个列内，数据的分布很明显受到工具的影响。在部分数据列中，缺失值已经被0或者其他的异常值填充。

三、数据预处理

1、分工序。对整个数据集按照工具列分为不同工序。基于数值观测，将chamber id列与tool列合并，并将operation_id

和chamber作为工具列进行工具划分。

2、数据清洗

将单一值列、空值列、重复列删除

3、将8位、16位等日期格式转换为从2016.1.1以来的秒数

4、将空白值（0与NA）填充为同一列其他非空值得平均值。

四、特征构建

1、将计算单因子和双因子交互列并纳入备选特征；

（1）X为特征原始值，Xerr为原始值与该列平均值之差，取绝对值得到Xerrabs

（2）对双因子（设为X和Y）建立X+Y，X-Y，X/Y、Y/X的特征向量。

2、备选特征筛选

既然一列能产出三个特征，一对列能产生十五个双因子特征，那么会产生很多备选特征。所以需要对特征进行最初的筛选。采用的是计算各列与特征值Value的pearson相关性，选取相关性高的进行保存。

3、模型选取尝试过SVR、LASSO、GBDT以及模型融合等。最终用了xgboost。

猜你喜欢

转载自blog.csdn.net/Jacoob1024/article/details/79954636

天池AI大赛智能制造预测赛题

【阿里ai】天池大赛

瞄准肺部CT多病征智能诊断，广西天池大赛深化“AI+医疗”共建“健康广西”

天池大赛——【新人赛】工业蒸汽量预测建模算法

天池大赛 > 【新人赛】工业蒸汽量预测建模算法

阿里云天池大赛赛题（机器学习）——天猫用户重复购买预测（完整代码）

阿里天池-全球数据智能大赛

Leetcode天池大赛压轴题分治dp

天池雪浪制造AI挑战赛（初赛）

天池-优惠卷预测大赛-模型预测

阿里云天池大赛赛题（深度学习）——人工智能辅助构建知识图谱（完整代码）

天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测总结

阿里天池大赛[人工智能辅助糖尿病遗传风险预测]赛后总结

阿里云天池大赛——机器学习篇赛题解析（赛题一）思维导图

阿里云天池大赛——机器学习篇赛题解析（赛题一）下

阿里云天池大赛——机器学习篇赛题解析（赛题一）上

天池—广东政务数据创新大赛—智能算法赛总结

数据挖掘实战之天池精准医疗大赛（1）——赛题与数据

阿里云天池大赛赛题（深度学习）——视频增强（完整代码）

阿里天池—2022江苏气象预测AI算法挑战赛

天池-AI美年健康大赛初赛-xgboost模型

天池入门赛--蒸汽预测

ML1 - 天池大赛 - O2O优惠券预测

天池大赛------工业蒸汽量预测（初学者专用，简单易懂）

天池大赛O2O新手赛解题思路分享

首次试水天池数据大赛——7个小时玩了把美年健康AI大赛

天池学习赛之贷款违约预测——Task1赛题理解

天池精准医疗大赛：人工智能辅助糖尿病遗传风险预测——新手第一次参加数据竞赛的收获与教训

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-企业科研_论文作业

《天池精准医疗大赛-人工智能辅助糖尿病遗传风险预测》模型复现和数据挖掘-论文_企业

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)