数据库+AI 无限畅想,WAIC 2022 世界人工智能大会滴水湖 AI 开发者创新论坛“当数据库遇上 AI”圆满结束

当前 AI 的应用无处不在,而在数据库领域,如果与 AI 结合起来,数据库索引加上 AI 后能进一步降本增效吗?数据库存储加上 AI 后能进一步压缩空间吗?数据库运维加上 AI 后能进一步自动化并提高安全性吗?甚至当数据库加上 AI 后,能够直接对业务产生决策影响吗?当数据库遇上 AI 后,能产生怎样的火花?

9 月 1-3 日,WAIC 2022 世界人工智能大会顺利召开,在 3 日进行的“滴水湖 AI 开发者创新论坛——当数据库遇上 AI”上,一众演讲嘉宾们带来了精彩的分享,为参会者答疑解惑。 

本论坛的指导单位是世界人工智能大会组委会办公室,由上海市人工智能行业协会主办,由开源中国(OSCHINA)与 LF AI & DATA 基金会联合承办。

本次活动由 Zilliz 开发者关系及市场运营负责人李晨主持。LF AI & DATA 董事会主席堵俊平首先带来了《LF AI & DATA 中国社区,以开放创新引领全球开源 AI 新格局》分享。堵俊平以全球视角介绍了当前 AI 的发展分布情况。他表示,中国、美国与欧洲目前引领着全球 AI 的发展,在细分领域上,互联网领域中国与美国因为有大的互联网公司,也有较丰富的应用与使用人群,所以在这一领域上较为领先;在智慧城市交通方面中美也引领全球自动驾驶;金融服务领域美国的金融创新更多一些;而智能制造领域,欧洲和中国作为制造业巨头,更多地引领了潮流;同时欧洲在企业管理上,有更多一些通过 AI 优化企业流程管理的创新尝试。而在这些背后,AI 人才是重要基础。

堵俊平介绍 LF AI & DATA 中国社区的愿景是凝聚中国的 AI 社区,以 LF AI & DATA 开源平台

携手全球 AI 人才,让中国 AI 社区能够成为引领全球 AI 发展的重要力量,让更多的中国 AI 项目和企业能够走向世界。他介绍了社区中一系列目前已经取得优秀成绩的开源项目与社区,包括 ADLIK、Angel、DELTA、EDL、FATE、FlagAI、Milvus、OpenBytes 与 OpenDatalogy。同时他表示,中国社区还成立了 MLOps Committee,共同推进 AI 工程化落地。LF AI & DATA 社区中国启航,奔赴全球,堵俊平欢迎全球热爱 AI 技术,对开原有热情的小伙伴一起加入,更多地贡献集体智慧,让中国的 AI 产业、AI 技术能够引领全球。

第四范式研发副总裁、基础技术负责人郑曌分享了为机器学习而生的数据库 OpenMLDB,他介绍了 AI 两大应用类型:感知类与决策类,其中 OpenMLDB 所处的决策类领域,代表技术为特征抽取与机器学习模型,一般应用包括风控、推荐系统等。郑曌表示,在这一类决策型应用中,为了获得高业务价值的模型,对于实时特征有很强的需求。但是,由数据科学家所构建的特征计算脚本,由于无法满足低延迟、高吞吐、高可用等生产级特性,因此无法直接上线。为了在生产环境中上线特征脚本用于模型推理,并且满足实时计算的性能要求,往往需要工程化团队进行代码重构和优化。那么,由于两个团队、两套系统参与了从离线开发到部署上线的全流程,线上线下一致性校验成为一个必不可少的步骤,其往往需要耗费大量的沟通成本、开发成本和测试成本。郑曌详细介绍了 OpenMLDB 的整体架构设计,并表示它正是为了达到特征平台从开发到部署的流程优化目标:开发即上线 ,以此来大幅降低人工智能的落地成本。

第三个议题关于非结构化数据,如今非结构化数据随处可见,与结构化数据不同的是,我们一般无法使用关系数据库去存储这些非结构化数据,这时候,出现了一种新的方向:向量数据库。向量数据库近几年的发展势头不小,国内也有一些发展。Zilliz 合伙人、技术总监栾小凡带来了《云原生向量数据库 Milvus 演进之路》分享。

栾小凡介绍了向量检索的概念、现状与痛点,并以 Milvus 的应用场景实践为例,分享了应对挑战的策略,最后还介绍了 Zilliz 向量数据库周边生态,包括非结构化数据 ETL 平台 Towhee、向量数据可视化工具 Feder、Milvus GUI 管理工具 Attu。

清华大学计算机系教授李国良分享了《自治数据库研究与挑战》。

当数据库遇上 AI,会产生两个大方向上的影响,一个是 AI for DB 的,一个是 DB for AI 的,也就是两者相互影响,带来新的能力。李国良介绍了这二者相互之间的助力方向,并提出了“端到端自治数据库系统”的概念,介绍了建设一个这样的数据库系统会遇到的挑战,包括模型的选择、模型验证、模型与训练数据的管理;同时详细介绍了应对挑战设计自治数据库系统的具体架构与逻辑。最后引导出端到端自治数据库 openGauss 以及其后续发展规划。

接下来中兴通讯标准与开源战略总监孟伟带来了《开源在 AI for 5G 领域的应用》分享。

表面上看这和 AI 数据库没有关系,但实际上二者有许多共同的地方,比如智能运维、智能分级、对大量数据的处理等,孟伟介绍了构成 AI for 5G 的引擎:标准+开源+产业联盟,他的分享让我们可以尝试从另一个角度来审视“数据库 + AI”并有所借鉴。

腾讯云数据库在 AI 方向上也有深刻的探索与积淀,腾讯云数据库技术负责人程彬带来的分享主题是《腾讯云数据库智能技术实践》

程彬介绍,传统云数据库在软件+硬件的架构下面临的挑战主要集中体现在两个方面,一方面是云厂商要解决可用保障、效率提升与成本优化问题,对于企业来说,开发效率、运营效率与成本挑战则是他们需要考虑的。而如今,除了软硬件,再加上 AI 能力,三位一体可以构建云原生的自治数据库系统,应对以往遇到的挑战。

程彬以腾讯云数据库的实践为例,从业务效率、运营效率与系统效率三个大方面,以及各方面具体的架构与策略细节,具体分析了如何去设计一个可以自分析、自演进的云原生自治数据库系统。

此次论坛还特别设置了圆桌 “刨根 AI 与数据库”,多位专家聚到一起交流讨论,让观众能够更加全面地了解这一前沿话题。

圆桌嘉宾包括 LF AI & DATA 董事会主席堵俊平、openGauss 开源数据库首席架构师黄凯耀、LF AI & DATA 董事郑曌、LF AI & DATA 基金会技术咨询委员成员栾小凡、LF AI & DATA 董事孟伟,并由 Zilliz 开发者关系及市场运营负责人李晨主持。

圆桌上各位嘉宾结合了各自企业的业务与行业现状,共同探讨了 AI 数据库的概念,当前行业里在国内国外、技术与市场上 AI 数据库的发展情况,AI 数据库主要解决哪些方面的问题,以及在发展 AI 数据库的过程中技术上会遇到哪些难点。

最后一个环节,Linux 基金会亚太区业务发展总监杨轩带来了论坛结束寄语,他表示,LF AI & DATA 基金会中,中国社区目前已经取得了非常好的成绩,在董事会与 TAC(技术咨询委员会)都拥有超过半数的话语权。杨轩呼吁更多的中国 AI 企业加入 LF AI & DATA 中国社区,让全球更多的 AI 人才加入,让中国成为引领全球 AI 发展的重要力量。

论坛全程干货满满,直播回放请查看:

猜你喜欢

转载自www.oschina.net/news/209061