スーパー ユニコーン Databricks の台頭

データ拡大と AI の台頭の時代において、データ ストレージと分析プラットフォームは大きな価値と力を持っています。 

インターネット データの爆発的な増加に伴い、データは企業にとって石油と同じくらい重要な新しいリソースとなっています。あらゆる種類の構造化データと非構造化データを有利に活用しようとする企業がますます増えています。

ただし、複雑なレガシー インフラストラクチャ、データ サイロの解決、高遅延の管理などの課題に直面しています。その結果、データレイクの必要性が徐々に高まってきました。データ レイクは、大量の生データをネイティブ形式で取り込むことができるリポジトリであり、企業が必要なときに簡単にアクセスできるようにします。

Databricks は現在、プライマリー市場におけるスーパー ユニコーン企業です。企業が分析用にデータを準備するのに役立ち、機械学習とデータ主導の意思決定を可能にします。また、データ サイエンスがデータ エンジニアリングや他のビジネス ユニットと連携してデータ製品を構築することも可能になります。現在では、より広範な Databricks マーケットプレイスへと拡張されました。

01 旅は Apache Spark から始まります

Databricks チームは、データ処理用の Spark エンジンに取り組んでいるコンピューター サイエンスの博士号を持つ 7 人で構成されています。このプロジェクトは 2014 年にデータソート速度の世界記録を樹立しました。

より多くのユーザーが Spark を使用できるようにするために、彼らは Spark をオープンソースにすることを選択し、2013 年に Databricks を設立しました。同年、同社はA16z主導による資金調達ラウンドを完了した。2016 年 1 月、Databricks には新しい CEO が就任しました。1年後、同社は最初の100万ドル規模の取引を成立させた。

全体として、Databricks チームは絶対的な影響力と理解を備えた Apache Spark の中核開発者であり、Spark の営利企業として Databricks が正当であると言えます。

02 収入の多様化に向けた製品ラインの拡充

Databricks は当初、データ レイクに保存されている大規模な非構造化データセットをクエリするための Spark に焦点を当てていました。それ以来、市場に対応するために、Databricks は、Spark 上に構築され、データ レイクの ACID トランザクションとデータ バージョン管理を提供する Delta Lake、管理用のオープンソース プラットフォームである MLflow を提供する、レイク ウェアハウス統合プラットフォームにアップグレードしました。機械学習ワークフロー、SQL ベースのデータ分析コラボレーション ツール Redash。

全体として、Databricks の統合レイクおよびウェアハウス プラットフォームは、データ レイクとデータ ウェアハウスの要素を組み合わせています。データ レイクの柔軟性、費用対効果、スケールを備えながら、データ ウェアハウスのデータ管理と ACID トランザクションを提供します。ユーザーは、すべてのデータに対してビジネス インテリジェンスと機械学習を有効にすることができます。

Databricks 製品は、AWS、Azure、GCP などの主要なクラウド サービスで利用でき、そのプラットフォームはデータ、分析、機械学習作業のための統合環境を提供します。視覚化は、これらのさまざまな活動に不可欠な部分となります。

出典: データブリックス

03 データレイク市場は成長しており、ユーザーは大規模、中規模、小規模にまたがっています

Databricks は、企業がデータを保存するためにサイロ化されたシステムを廃止し、代わりに一元化されたデータ ストレージを選択していると考えています。このアプローチは、企業がビジネス インテリジェンスと予測分析を通じて過去および将来のトレンドに対する洞察を得るのに役立ちます。

データ レイク テクノロジーはこれに基づいており、すべてのデータ タイプとソースを一緒に保存できます。データによると、データレイク市場は2019年の79億ドルから2024年には201億ドルに成長すると予想されています。

出典: マーケットアンドマーケット

さらに、Databricks の顧客は大企業から中小企業、さらにはさまざまな業界に及びます。2023 年 3 月現在、世界中で 9,000 社を超える企業ユーザーがいます。AT&T、シェル、バーバリー、トヨタ、アドビ、コンデナスト、リジェネロン・ファーマシューティカルズなどが含まれます。

2022 年第 2 四半期末時点の Databricks の ARR 10 億ドルを、2022 年第 2 四半期末時点の 7,000 人以上の顧客数で割ると、Databricks の ACV (平均契約額) は約 143,000 ドルと概算できます。 Snowflake の 301,000 ドル (2023.Q3 推定) に対して、まだ改善の余地があります。

04 3タイプの相手の側面攻撃

2012 年に元 Oracle アーキテクトによって設立された Snowflake は、Databricks にとって無視できないライバルです。当初、Snowflake は自らを、主にビジネス アナリストやデータ エンジニアなどのユーザー向けに、データ ウェアハウスと分析コンピューティングのワークロードを提供するクラウド データ プラットフォームとして位置づけていました。同じ時期に、Databricks はデータ サイエンティストや機械学習エンジニアに支持されてきました。

しかし現在では、この 2 つの境界があいまいになりつつあり、たとえば、Snowflak はデータ サイエンティストの誘致を目指して、データ サイエンス、トランザクション データベース、Python サポート機能向けの Snowpark をリリースしました。また、Databricks は、データ ストレージやセキュリティを重視する顧客に応えるために、Databricks SQL、Delta Lake 機能、Unity カタログなどの製品を発売しました。

モデルの観点から見ると、Snowflake はクローズドソースのエコロジーですが、Databricks はオープンソースです。Databricks の主要な製品ラインは無料で使用でき、顧客がより高度な機能やサポートが必要な場合は、Databricks のエンタープライズ製品を選択できます。Snowflake は企業が基本的な分析を迅速に実行できる既製のソリューションを提供し、Databricks はより優れたカスタマイズと構成を提供し、顧客がセットアップを完全に制御できるようにします。

2022 年末までに、Snowflake の年間収益は 21 億ドルになり、Databricks の年間収益は 14 億ドルになると予測されています。両者の競争はさらに激化することが予想される。

2 番目のカテゴリーの競合他社はクラウド ベンダーです。Databricks は、クラウド ベンダーが提供する独自の製品と競合します。たとえば、ビッグデータ処理に関しては、AWS には Amazon EMR、Azure には Azure HDInsight、GCP には Dataproc があります。ビジネス分析ソリューションのレベルでは、Amazon QuickSight、Azure の Power BI Embedded、GCP の Looker はすべて Databricks と競合します。

最後に、Databricks は特定のデータ管理および科学分野のソリューション企業とも競合しています。たとえば、Databricks のスケジューラは Apache Airflow に似ており、MLflow 製品は DataRobot や Alteryx と競合します。

05 持続的な収益成長、資本からも認められるスーパーユニコーン

Databricks 自体はオープンソース ソフトウェアであり、追加機能を提供することで課金されます。Databricks は、クエリを作成するための SaaS ツールやデータ ソースに接続するためのコネクタなどの追加ツールとともに、オープンソース ソフトウェアのフルマネージド バージョンを企業に提供します。

支払いモデルに関しては、Databricks は顧客が消費した 1 秒あたりのコンピューティング リソースの量に応じて料金を請求します。この目的のために、標準化された単位として独自の DBU を使用します。ワークロードによって消費される DBU の数は、使用されるコンピューティング リソース、処理されるデータ量、リージョン、段階的な価格レベルなどの複数の指標によって決まります。 、使用されるサービスの種類など。

さらに、ユーザーを引き付けるために、他のオープンソース企業と同様に、Databricks もユーザーに 14 日間の無料試用期間を提供しています。

出典: データブリックス

Databricks は財務面でも飛躍的に成長しました。2019.Q3終了時点でのARRは2億ドル、2020年の年間収益は4億2,500万ドル、2021年のARRは8億ドルを超えました。2022 年 8 月の時点で、Databricks の ARR は 10 億ドルを超え、年間成長率は 70% 以上です。

2021 年 8 月の時点で、Databricks の評価額は 380 億ドルで、資本市場で総額 35 億ドルを調達しており、投資家には A16z、Tiger Global、Amazon Web Services、Microsoft、Coatue などのスターも名を連ねています。

もちろん、2022年10月にデータブリックスが社内株価を引き下げ、評価額を2021年の同時期から約7%下落する310億ドルに下げたというニュースもある。しかし、いずれにせよ、Databricks は依然としてプライマリーマーケットにおけるスーパーユニコーンです。

06 トレンド、機会、リスク

クラウド ストレージのコストが低下し、インターネットの速度が向上するにつれて、企業はさまざまな種類のデータを個別に保存するのではなく、すべてのデータを中央リポジトリに保存することを選択することが増えています。この一元化の傾向は、企業がリアルタイムのビジネス インテリジェンスと予測分析を通じて事業運営の可視性を向上させるのに役立ちます。同時に、データの爆発的な増加により、企業が複数の大規模なデータ ストアを維持することが現実的ではなくなり、データ レイクとデータ ウェアハウスが 1 つのプラットフォームに統合されるようになりました。

ChatGPT は常にさまざまな業界で注目を集めています。Databricks も、データ チームがデータを保存して保護し、分析と洞察を生成し、機械学習ツールの開発を推進できるウェアハウス イン レイク プラットフォームでその波に乗ります。さらに、Databricks は TensorFlow、PyTorch などの一般的な人工知能フレームワークとの統合も提供し、機械学習モデルの構築とデプロイを容易にします。

Databricks は、AWS、Azure、GCP などのクラウド インフラストラクチャ プロバイダーに依存してサービスを提供しています。振り返ってみると、Microsoft との提携は Databricks にとってマイルストーンであり、そのおかげで同社の収益は 2017 年初めの 100 万ドル未満から 2018 年には 1 億ドルを超えるまでに成長しました。大手クラウドベンダーとの関係が変化すれば、Databricksのサービス能力に影響が出るだろう。

要約すると、課題はあるものの、データ拡大と AI の台頭のこの時代において、Databricks は企業に価値のある単一のデータ ストレージおよび分析プラットフォームを提供し、それを掴むための大きな機会と機能を備えていると信じる理由があります。この機会に波を。

著者について

鄭波、阿嘉港港。Cui Niuhui 氏はバターでは有名ではありませんが、2B インフラストラクチャ起業家精神の中年のベテランであり、CnosDB クラウドネイティブ時系列データベースのオープンソース コミュニティの創始者です。

CnosDB の概要

CnosDB は、正式にリリースされ、完全にオープンソース化された、高性能で使いやすさの高いオープンソースの分散時系列データベースです。

私たちのコミュニティ Web サイトへようこそ: https://www.cnosdb.com

おすすめ

転載: blog.csdn.net/CnosDB/article/details/130665115