Meetup | 机器学习工作流的分解及虚拟数据湖的应用

2022年9月23日(周五)上午10:00-11:00,由Alluxio举办的【Meetup】即将强势呈现!

本期邀请到的嘉宾是:Alluxio产品经理——欧阳婧雯

欧阳婧雯本科和硕士均毕业于麻省理工,热爱技巧性滑雪,曾就职于Meta (Facebook), SanDisk,具备丰富的实战经验,而本期分享的主题是:《机器学习工作流的分解及虚拟数据湖的应用》

数据湖在异构数据存储方面的优势令其成为机器学习基础设施的首选,然而,传统的数据湖是资源密集型技术,依赖于代价高昂的永久数据拷贝,从而在数据创建和分析之间造成了延迟。随着时间的推移,这种延迟会逐渐造成新的数据孤岛的出现。

成功落地机器学习不仅要统一管理异构数据,还要实现顺畅的工作流。一个机器学习模型的端到端生产工作流一般分为五步,即数据收集, 数据预处理, 模型训练, 模型评估, 模型推论,本次分享会围绕它们的特色以及与数据的关系,同时还会包含在各个步骤中Alluxio作为虚拟数据湖的应用和带来的好处,更多详细内容可关注9月23日的直播活动,听婧雯老师细细道来:

【点击报名】

{{o.name}}
{{m.name}}

猜你喜欢

转载自my.oschina.net/u/5904778/blog/5577510