Motianlun国内データベースサロン|4次元アスペクトYaoYandong:MatrixDB、オールインワン高性能時系列データベース

ゲストの共有Yao Yandong、Beijing Siwei Zongheng Data Co.、Ltd.の創設者、Greenplum Beijing R&D Centerの元ゼネラルマネージャー、Greenplum China Open Source Communityの創設者、PostgreSQL Chinese Communityの常任委員会のメンバー、および102 Motianlun Community

ガイド付き読書

モノのインターネット、車両のインターネット、インダストリアルインターネットの急速な発展は、私たちがモノのインターネットの時代に加速していることを示しており、時系列データベースはデータアーキテクチャテクノロジースタックの標準構成になっています。

グローバルなハイパーコンバージド時系列データベースのパイオニアとして、 MatrixDBは、モノのインターネット、車両のインターネット、産業用インターネット、スマートシティ向けのワンストップデータプラットフォームです。今日共有したコンテンツは、時系列データと時系列データベース、MatrixDB機能、およびMatrixDBケースの4つのトピックに分かれています。

時系列データ

1.時系列データとは何ですか?

まず第一に、時系列はより遠近法であり、過去への洞察を得て、未来を分析し、現在を決定するために使用されます。

スナップショットと同様に、指標データ、位置データ、点群データ、画像データなど、さまざまなデータが常に生成されます。異なる時間での連続データの蓄積は、時系列データである時系列を形成します。

ある瞬間、私たちは現在の状態を知ることができ、これらの瞬間の重ね合わせは、過去への洞察を得て、未来を分析し、決定することができます。これは時系列データベースの大きな価値です。

時系列データはいたるところにあり、急速に成長しています。将来的には、時系列データの量はどんどん大きくなり、どこでも利用できるようになります。時系列データを実際の価値にするためには、リレーショナルデータと統合する必要があります。

2.基本的な概念とモデリング

時系列データには、ナローテーブルモード、ワイドテーブルモード、ツリーモードの3つのモデリング方法があります。

  • ナローテーブルモード:ソートされたKVと同様に、1つのバーは1つのデータポイントを表し、コアはインジケーターであり、弱い機器の概念です。
  • ワイドテーブルモード:1行は複数のデータポイントを表し、コアはデバイスまたはエンティティです
  • ツリーモード、コアはインジケーターであり、狭いテーブルとの違いは、メタデータが階層的に編成されていることです。

3つのモードがあります。ナローテーブルの書き込みは柔軟、ワイドテーブルクエリは柔軟、ツリーは中央に配置されます。

図13つのモデリングモードの比較

時系列データベース

1.時系列データベースの開発と進化

時系列データベースの開発は1980年代にさかのぼることができます。初期の時系列データベースは特定のシナリオ用です。

MatrixDBは2020年に設立されました。InternetofEverythingのトレンドの下で、モノのインターネット、車両のインターネット、およびインダストリアルインターネット用に設計された特別なデータベースです。

図2時系列データベースの進化の歴史

2.時系列データベースの開発動向

  • トレンド1:モニタリングから分析まで

過去には、時系列シナリオは主にサーバーの監視に使用され、数万台のサーバーのみが7日から30日間データを保存していました。データの量は少なく、主な目的は監視でしたが、モノのインターネット、産業用モノのインターネット、および車両のインターネット、データの量主な目的は、分析を通じて大量の時系列データの価値を分析およびマイニングすることです。

  • 2番目の主要な傾向:狭いテーブルから広いテーブルへのデータモデル

「ナローテーブル」と比較して、「ワイドテーブル」は、ビジネス関連の測定ポイント、ディメンション、および属性情報を1つまたは複数のデータベーステーブルに格納でき、高いストレージ効率と高速性を備えており、大量のデータや複雑なビジネスシナリオに適しています

モノのインターネット、産業用モノのインターネット、およびモノのインターネットのシナリオの台頭に伴い、時系列データベースは分析にますます注意を払い、より多くのワイドテーブルモデルがあります。近年登場したのもワイドテーブルモデルが圧倒的。

  • 3番目の主要な傾向:ペタバイトレベルへのデータスケール

モノのインターネットの発展に伴い、データの規模は以前のGB/TBレベルからPBレベルへとますます大きくなります。

  • 4番目の主要なトレンド:テクノロジースタックからハイパーコンバージド時系列データベースへ

さまざまなオープンソースソフトウェアの構築から、ONEFORALLアーキテクチャまで。オッカムの剃刀の原理を利用して、「必要な場合を除いて、エンティティを乗算しないでください」。データベースでできることは、処理するのにあまり多くのデータベースを必要としないことです。

したがって、MatrixDBの目標は、「ミニマリズム」と「極度の速度」をユーザーに任せ、複雑さをデータベース開発者に任せることです。

図3時系列データベースの今後の開発動向

MatrixDBの機能

1.MatrixDB製品の紹介

MatrixDBは、世界初のハイパーコンバージド時空間データベースです。独自に開発した多数の特許技術に基づいて、大量の時空間データの迅速な収集、効率的なストレージ、リアルタイム分析、ディープラーニング(ML + AL)を実現します。50倍です。従来のMPPデータベースよりも高速で、スペースを60%以上節約し、3〜100倍高速です。

Matrix DBは、エネルギー、航空宇宙、自動車および車両のインターネット、インテリジェントな製造および産業用インターネット、金融、保険、証券、5G通信、レーダーおよび気象学、スマート農業、生物医学研究開発、スマートシティ、スマートホームなどで広く使用されています。産業、インテリジェントモニタリング、リアルタイム制御、機器のトレーサビリティ、ユーザーポートレート、行動分析、予測分析などのさまざまなアプリケーションシナリオをカバーし、モノのインターネット、車両のインターネット、産業用インターネット、スマートライフ。

図4MatrixDBのパノラマ

2.MatrixDB製品の利点

  • オールインワン:データベースは、時系列データ、GISデータ、従来のリレーショナルデータ、KVデータ、JSONデータなど、さまざまなデータタイプを直接処理します。

  • 安定性と信頼性:MatrixDBは、オープンソースのGreenplumとPostgreSQLに基づいて開発されており、どちらも数十年にわたって蓄積されてきました。研究開発には、数十万の静的テストとカオステストの2つのカテゴリに分類される多くのテストケースもあり、MatrixDBは巨人の肩の上に立っていると言えます。

  • 大規模:大量のデータの規模がPBレベルのデータ量に達し、データベースは100 PBレベルのデータをサポートできる必要があり、多数のノードのスケーラビリティ、線形拡張機能が強力であり、ノードは次のことができます。いつでも追加できます。機能は線形成長であり、線形拡張ポイントは、最小のクラスターがサポートできるデータの量です。

  • 高性能:MatrixDBはGreenplumでサポートされており、コアMPPをメインアーキテクチャとして使用します。これに基づいて、時系列シナリオ用に特別に最適化されたエグゼキュータと時系列シナリオ用に最適化されたメモリが追加されます。

  • 完全なエンタープライズレベルの機能:データベースの場合、POCはパフォーマンスに重点を置いています。本番環境に入ると、安定性と操作性にさらに注意を払います。MatrixDBには、監視とアラーム、オンライン容量の拡張、バックアップとリカバリなどの完全なエンタープライズレベルの機能があります。およびセキュリティ制御。

  • 完全なエコシステム:PostgreSQL 12 / Greenplumと互換性があり、Hadoopエコシステムにシームレスに接続し、データベース内で機械学習トレーニングを実行し、PythonやRなどのUDFをサポートします。

図5MatrixDB製品の利点

MatrixDBの場合

MatrixDBのアプリケーションケースは、主に3つのカテゴリに分類されます。デジタルツインインテリジェント機器ファクトリーブレインのインテリジェント製造、および従来のデータウェアハウスのリアルタイム分析です

図6MatrixDBのケースシナリオの分類

1.ケース1:新車メーカー

新エネルギーの創出の勢いは急速に高まっており、年間売上高の伸び率は200%を超えています。これまで、OpenTSDB + Hiveに基づく技術アーキテクチャは、急速に増大するデータ量とビジネスをサポートできず、イノベーションと反復の速度は限定的で、開発のボトルネックになりました。

MatrixDBで構築した後、効果は明ら​​かで、ハードウェアコストが80%削減され、書き込み効率が10倍になり、特定のクエリ効率が100倍になり、開発運用と保守の効率が1倍になります。 。

図7自動車製造の新しい力におけるMatrixDBのアプリケーションケース

2.ケース2:エネルギー技術の巨人

バッテリーの充電および放電データ分析に基づくパワーバッテリー製造の巨人は、バッテリーのヘルスチェック、バッテリーのリスク警告、バッテリープロセスの最適化などの主要なビジネスをサポートします。急速なビジネスの成長により、Spark+Hiveベースのアーキテクチャがボトルネックになっています。

MatrixDBの構築後、500 TBのバッテリー充電および放電データを保存する効果を達成し、コンピューティングオーバーヘッドの85%とストレージオーバーヘッドの30%を節約しました。

図8新エネルギー技術におけるMatrixDBのアプリケーションケース

3.ケース3:機器製造の巨人

インテリジェントな機器の運用、保守、最適化機器製造業界の巨人は、製品の使用プロセスを完全に理解し、運用と保守の管理、予知保全、電力最適化など

MySQL / TDEngine / Greenplum / SparkをAll-in-Oneに置き換えると、クラスターハードウェアの半分を節約し、パフォーマンスを6倍向上させることができます。

図9機器製造業におけるMatrixDBのアプリケーションケース

4.ケース4:ロジスティクスIoTサービスプロバイダー

建設効果:

  • 月間データ量:300TB
  • リアルタイムポジショニング:100msリターン、1000同時
  • 1日トラックは500ms以内に戻り、3日トラックは1秒以内に戻ります
  • データ遅延は1分以内

図10ロジスティクスインターネットサービスプロバイダーにおけるMatrixDBのアプリケーションケース

5.ケース5:州の工場の頭脳

2021年11月、いくつかの最終組立生産ライン、切断機、CNC工作機械の接続、およびアンジとベトナムの2つのERPシステムと1つのMESシステムへのすべてのデータクリーニングと標準化されたアクセスが完了し、第1段階が実現しました。透明な工場を建設するという目標は、22年以内に州全体で推進されます。

図11州の工場の頭脳におけるMatrixDBのアプリケーションケース

6.ケース6:製薬会社

従来の産業用ビッグデータは「複雑」で「非効率的」であり、入力が多く出力が少ないため、多くの産業企業は「ビッグデータ」について別の方法で話します。MatrixDBをベースにした産業用ビッグデータプラットフォームは、ビッグデータの複雑さの問題を解決し、顧客としての「ミニマリズム」と「極度のスピード」を維持します。

図12製薬会社におけるMatrixDBのアプリケーションケース

7.ケース7:製造企業

国際的に有名な製造企業は、工場からさまざまなデータを収集し、歩留まりに影響を与える主な要因を分析し、生産プロセスを改善し、コストを削減して効率を高め、利益率を大幅に向上させます。

図13製造企業におけるMatrixDBのアプリケーションケース

以上が本日共有させていただきます、ありがとうございました!

よりエキサイティングなコンテンツについては、ビデオ再生と会議資料のビデオ再生をご覧ください:https ://www.modb.pro/video/6115会議資料:https ://www.modb.pro/doc/57017


Motianlunは、データ担当者の学習と成長に関するワンストップの包括的なサービスを提供し、ニュース、オンラインQ&A、ライブイベント、オンラインコース、ドキュメントの読み取り、リソースのダウンロード、知識の共有、オンラインの運用と保守を統合する統合プラットフォームを作成します。データの分野で知識の普及と技術革新を促進する。

公式パブリックアカウントに従ってください:Motianlun、Motianlunプラットフォーム、Motianlun成長キャンプ、データベースのローカリゼーション、データベース情報

{{o.name}}
{{m.name}}

おすすめ

転載: my.oschina.net/u/4559794/blog/5488285