开源查询引擎 Trino(Presto)10 岁了

十年前,Dain Sundstrom、Martin Traverso、David Phillips 和 Eric Hwang 在 Facebook 共同创建了最初的 Presto,这是一种大规模并行处理 SQL 引擎,旨在解决 Facebook 大型数据集的快速分析和查询问题。

在此之前,Facebook 的数据分析师依靠的还是 Apache Hive 在其数 PB 的数据仓库中运行 SQL 分析。对 Facebook 所拥有的这种规模数据来说,Apache Hive 还是太慢了。2012 年 Presto 正式诞生,很好地填补了这一空白,并于当年晚些时候在 Facebook 部署。

到 2013 年 11 月,Facebook 将 Presto 正式开源。开源后,Presto 已被 Netflix、LinkedIn 和 Teradata 等公司采用。

2017 年,此前采用了 Presto 的 Teradata 分拆出一家名为 Starburst Data 的公司,为 Presto 提供商业支持。

2018 年,这些创作者与 Facebook 分道扬镳,原始代码也被划为两个分支,留在 Facebook 下的被称为 PrestoDB,另一个由原创作者继续维护的则被称为 PrestoSQL。

2019 年 9 月,Facebook 将 PrestoDB 捐赠给了 Linux 基金会,成立了 Presto 基金会。但无论是 Presto 的创作者,还是顶级贡献者和提交者,都没有被邀请加入这个基金会。

2020 年,Presto 所有四位原始创作者都加入了此前提到的 Starburst 公司。同年 12 月,由于 Facebook 已经获得了 "Presto" 这个名字的商标,PrestoSQL 被重新命名为 Trino,从那时起,整个社区在新名字下蓬勃发展。

也就是说,虽然如今是 Starburst 在主导项目发展与 Trino 社区的维护,但 Starburst 公司的历史还没有 Trino 项目的创立时间久。

展望未来 Dain Sundstrom 表示,他对 Trino 和它的未来感到兴奋,因为他们仍在为 Trino 添加新的功能和特性,用例能够覆盖更多工作负载和数据类型。Trino 能够适用的范围也会越来越广 —— 例如,增加处理地理空间数据的功能意味着地图公司、手机供应商和食品配送公司可以从分析客户数据中获得附加值。

官方博客中,Starburst 表示:

我们为在帮助 Trino 成为今天这样一个成熟的项目中所扮演的角色而感到自豪,包括我们自己做出的创新以及与我们的生态合作伙伴合作创造的创新。

猜你喜欢

转载自www.oschina.net/news/206331/trino-turns-ten