学习笔记——2020 AI开发者万人大会week3——AutoML

AutoML技术

AutoML是一系列技术的集合。
数据:数据自动清洗,线性分形技术
特征:并行多尺度特征的重要性;超高阶可解释强的自动特征组合;目标驱动的时序特征提取;深度时序特征表征
模型:高效率样本采样优化;启发式算法配置搜索;多保真超参优化;超参数优化集成
借助AutoML 降低技术门槛,带领企业进入AI自动化时代
在这里插入图片描述AI优化要点:
高维:特征越多越好,高维特征可以挖掘出更多细节,有效的减少信息损失以广告投放为例-千人千面->对数据采集要求提高;
尽可能不降维->对模型训练计算框架和模型上线工程化要求能力极高
特征工程X做多:自动特征组合、自动时序特征、自动特征变化、自动离散化
特征组合:会组合出更有意义的特征表述(权重值较高)
在这里插入图片描述
实时:
预测实时:用户行为频繁的场景使用实时预估-贴近真实世界
实时特征计算:高维时序特征
模型实时更新:模型增量自学习
Q;Why we need timing/sequential characters?历史流水型数据压缩仅当前模型
闭环:
AI应用的痛点:
数据:数据采集,数据清洗
特征:特征构造,时序特征如何防止穿越
模型:如何完成大数据高纬度的模型训练,如何构造“即宽又深”的模型
应用:如何上线具有复杂特征的模型,如何兼顾模型(特征)复杂性与预测实时性;如何保障线上线下一致性
数据回流:如何快速收集最新反馈并用于模型更新

实操:科大讯飞广告CTR

在这里插入图片描述导入数据(行为数据、反馈数据)->数据扩增->特征组合
算法PK:选择适合当前数据的算法(3)
调参

申请下账号试用一下

猜你喜欢

转载自blog.csdn.net/qq_37151108/article/details/106437358