ゲストの共有:Yao Yandong、Beijing Siwei Zongheng Data Co.、Ltd.の創設者、Greenplum Beijing R&D Centerの元ゼネラルマネージャー、Greenplum China Open Source Communityの創設者、PostgreSQL Chinese Communityの常任委員会のメンバー、および102 Motianlun Community
ガイド付き読書
モノのインターネット、車両のインターネット、インダストリアルインターネットの急速な発展は、私たちがモノのインターネットの時代に加速していることを示しており、時系列データベースはデータアーキテクチャテクノロジースタックの標準構成になっています。
グローバルなハイパーコンバージド時系列データベースのパイオニアとして、 MatrixDBは、モノのインターネット、車両のインターネット、産業用インターネット、スマートシティ向けのワンストップデータプラットフォームです。今日共有したコンテンツは、時系列データと時系列データベース、MatrixDB機能、およびMatrixDBケースの4つのトピックに分かれています。
時系列データ
1.時系列データとは何ですか?
まず第一に、時系列はより遠近法であり、過去への洞察を得て、未来を分析し、現在を決定するために使用されます。
スナップショットと同様に、指標データ、位置データ、点群データ、画像データなど、さまざまなデータが常に生成されます。異なる時間での連続データの蓄積は、時系列データである時系列を形成します。
ある瞬間、私たちは現在の状態を知ることができ、これらの瞬間の重ね合わせは、過去への洞察を得て、未来を分析し、決定することができます。これは時系列データベースの大きな価値です。
時系列データはいたるところにあり、急速に成長しています。将来的には、時系列データの量はどんどん大きくなり、どこでも利用できるようになります。時系列データを実際の価値にするためには、リレーショナルデータと統合する必要があります。
2.基本的な概念とモデリング
時系列データには、ナローテーブルモード、ワイドテーブルモード、ツリーモードの3つのモデリング方法があります。
- ナローテーブルモード:ソートされたKVと同様に、1つのバーは1つのデータポイントを表し、コアはインジケーターであり、弱い機器の概念です。
- ワイドテーブルモード:1行は複数のデータポイントを表し、コアはデバイスまたはエンティティです
- ツリーモード、コアはインジケーターであり、狭いテーブルとの違いは、メタデータが階層的に編成されていることです。
3つのモードがあります。ナローテーブルの書き込みは柔軟、ワイドテーブルクエリは柔軟、ツリーは中央に配置されます。
図13つのモデリングモードの比較
時系列データベース
1.時系列データベースの開発と進化
時系列データベースの開発は1980年代にさかのぼることができます。初期の時系列データベースは特定のシナリオ用です。
MatrixDBは2020年に設立されました。InternetofEverythingのトレンドの下で、モノのインターネット、車両のインターネット、およびインダストリアルインターネット用に設計された特別なデータベースです。
図2時系列データベースの進化の歴史
2.時系列データベースの開発動向
- トレンド1:モニタリングから分析まで
過去には、時系列シナリオは主にサーバーの監視に使用され、数万台のサーバーのみが7日から30日間データを保存していました。データの量は少なく、主な目的は監視でしたが、モノのインターネット、産業用モノのインターネット、および車両のインターネット、データの量主な目的は、分析を通じて大量の時系列データの価値を分析およびマイニングすることです。
- 2番目の主要な傾向:狭いテーブルから広いテーブルへのデータモデル
「ナローテーブル」と比較して、「ワイドテーブル」は、ビジネス関連の測定ポイント、ディメンション、および属性情報を1つまたは複数のデータベーステーブルに格納でき、高いストレージ効率と高速性を備えており、大量のデータや複雑なビジネスシナリオに適しています。
モノのインターネット、産業用モノのインターネット、およびモノのインターネットのシナリオの台頭に伴い、時系列データベースは分析にますます注意を払い、より多くのワイドテーブルモデルがあります。近年登場したのもワイドテーブルモデルが圧倒的。
- 3番目の主要な傾向:ペタバイトレベルへのデータスケール
モノのインターネットの発展に伴い、データの規模は以前のGB/TBレベルからPBレベルへとますます大きくなります。
- 4番目の主要なトレンド:テクノロジースタックからハイパーコンバージド時系列データベースへ
さまざまなオープンソースソフトウェアの構築から、ONEFORALLアーキテクチャまで。オッカムの剃刀の原理を利用して、「必要な場合を除いて、エンティティを乗算しないでください」。データベースでできることは、処理するのにあまり多くのデータベースを必要としないことです。
したがって、MatrixDBの目標は、「ミニマリズム」と「極度の速度」をユーザーに任せ、複雑さをデータベース開発者に任せることです。
図3時系列データベースの今後の開発動向
MatrixDBの機能
1.MatrixDB製品の紹介
MatrixDBは、世界初のハイパーコンバージド時空間データベースです。独自に開発した多数の特許技術に基づいて、大量の時空間データの迅速な収集、効率的なストレージ、リアルタイム分析、ディープラーニング(ML + AL)を実現します。50倍です。従来のMPPデータベースよりも高速で、スペースを60%以上節約し、3〜100倍高速です。
Matrix DBは、エネルギー、航空宇宙、自動車および車両のインターネット、インテリジェントな製造および産業用インターネット、金融、保険、証券、5G通信、レーダーおよび気象学、スマート農業、生物医学研究開発、スマートシティ、スマートホームなどで広く使用されています。産業、インテリジェントモニタリング、リアルタイム制御、機器のトレーサビリティ、ユーザーポートレート、行動分析、予測分析などのさまざまなアプリケーションシナリオをカバーし、モノのインターネット、車両のインターネット、産業用インターネット、スマートライフ。
図4MatrixDBのパノラマ
2.MatrixDB製品の利点
-
オールインワン:データベースは、時系列データ、GISデータ、従来のリレーショナルデータ、KVデータ、JSONデータなど、さまざまなデータタイプを直接処理します。
-
安定性と信頼性:MatrixDBは、オープンソースのGreenplumとPostgreSQLに基づいて開発されており、どちらも数十年にわたって蓄積されてきました。研究開発には、数十万の静的テストとカオステストの2つのカテゴリに分類される多くのテストケースもあり、MatrixDBは巨人の肩の上に立っていると言えます。
-
大規模:大量のデータの規模がPBレベルのデータ量に達し、データベースは100 PBレベルのデータをサポートできる必要があり、多数のノードのスケーラビリティ、線形拡張機能が強力であり、ノードは次のことができます。いつでも追加できます。機能は線形成長であり、線形拡張ポイントは、最小のクラスターがサポートできるデータの量です。
-
高性能:MatrixDBはGreenplumでサポートされており、コアMPPをメインアーキテクチャとして使用します。これに基づいて、時系列シナリオ用に特別に最適化されたエグゼキュータと時系列シナリオ用に最適化されたメモリが追加されます。
-
完全なエンタープライズレベルの機能:データベースの場合、POCはパフォーマンスに重点を置いています。本番環境に入ると、安定性と操作性にさらに注意を払います。MatrixDBには、監視とアラーム、オンライン容量の拡張、バックアップとリカバリなどの完全なエンタープライズレベルの機能があります。およびセキュリティ制御。
-
完全なエコシステム:PostgreSQL 12 / Greenplumと互換性があり、Hadoopエコシステムにシームレスに接続し、データベース内で機械学習トレーニングを実行し、PythonやRなどのUDFをサポートします。
図5MatrixDB製品の利点
MatrixDBの場合
MatrixDBのアプリケーションケースは、主に3つのカテゴリに分類されます。デジタルツインインテリジェント機器、ファクトリーブレインのインテリジェント製造、および従来のデータウェアハウスのリアルタイム分析です。
図6MatrixDBのケースシナリオの分類
1.ケース1:新車メーカー
新エネルギーの創出の勢いは急速に高まっており、年間売上高の伸び率は200%を超えています。これまで、OpenTSDB + Hiveに基づく技術アーキテクチャは、急速に増大するデータ量とビジネスをサポートできず、イノベーションと反復の速度は限定的で、開発のボトルネックになりました。
MatrixDBで構築した後、効果は明らかで、ハードウェアコストが80%削減され、書き込み効率が10倍になり、特定のクエリ効率が100倍になり、開発運用と保守の効率が1倍になります。 。
図7自動車製造の新しい力におけるMatrixDBのアプリケーションケース
2.ケース2:エネルギー技術の巨人
バッテリーの充電および放電データ分析に基づくパワーバッテリー製造の巨人は、バッテリーのヘルスチェック、バッテリーのリスク警告、バッテリープロセスの最適化などの主要なビジネスをサポートします。急速なビジネスの成長により、Spark+Hiveベースのアーキテクチャがボトルネックになっています。
MatrixDBの構築後、500 TBのバッテリー充電および放電データを保存する効果を達成し、コンピューティングオーバーヘッドの85%とストレージオーバーヘッドの30%を節約しました。
図8新エネルギー技術におけるMatrixDBのアプリケーションケース
3.ケース3:機器製造の巨人
インテリジェントな機器の運用、保守、最適化機器製造業界の巨人は、製品の使用プロセスを完全に理解し、運用と保守の管理、予知保全、電力最適化など
MySQL / TDEngine / Greenplum / SparkをAll-in-Oneに置き換えると、クラスターハードウェアの半分を節約し、パフォーマンスを6倍向上させることができます。
図9機器製造業におけるMatrixDBのアプリケーションケース
4.ケース4:ロジスティクスIoTサービスプロバイダー
建設効果:
- 月間データ量:300TB
- リアルタイムポジショニング:100msリターン、1000同時
- 1日トラックは500ms以内に戻り、3日トラックは1秒以内に戻ります
- データ遅延は1分以内
図10ロジスティクスインターネットサービスプロバイダーにおけるMatrixDBのアプリケーションケース
5.ケース5:州の工場の頭脳
2021年11月、いくつかの最終組立生産ライン、切断機、CNC工作機械の接続、およびアンジとベトナムの2つのERPシステムと1つのMESシステムへのすべてのデータクリーニングと標準化されたアクセスが完了し、第1段階が実現しました。透明な工場を建設するという目標は、22年以内に州全体で推進されます。
図11州の工場の頭脳におけるMatrixDBのアプリケーションケース
6.ケース6:製薬会社
従来の産業用ビッグデータは「複雑」で「非効率的」であり、入力が多く出力が少ないため、多くの産業企業は「ビッグデータ」について別の方法で話します。MatrixDBをベースにした産業用ビッグデータプラットフォームは、ビッグデータの複雑さの問題を解決し、顧客としての「ミニマリズム」と「極度のスピード」を維持します。
図12製薬会社におけるMatrixDBのアプリケーションケース
7.ケース7:製造企業
国際的に有名な製造企業は、工場からさまざまなデータを収集し、歩留まりに影響を与える主な要因を分析し、生産プロセスを改善し、コストを削減して効率を高め、利益率を大幅に向上させます。
図13製造企業におけるMatrixDBのアプリケーションケース
以上が本日共有させていただきます、ありがとうございました!
よりエキサイティングなコンテンツについては、ビデオ再生と会議資料のビデオ再生をご覧ください:https ://www.modb.pro/video/6115会議資料:https ://www.modb.pro/doc/57017
- 元のテキストを表示する:https ://www.modb.pro/db/337182
- [国内データベースサロン]の過去のエコロジーツール、グラフデータベースの特別記事、およびビデオ再生リソースを確認してください:https ://www.modb.pro/topic/157860
Motianlunは、データ担当者の学習と成長に関するワンストップの包括的なサービスを提供し、ニュース、オンラインQ&A、ライブイベント、オンラインコース、ドキュメントの読み取り、リソースのダウンロード、知識の共有、オンラインの運用と保守を統合する統合プラットフォームを作成します。データの分野で知識の普及と技術革新を促進する。
公式パブリックアカウントに従ってください:Motianlun、Motianlunプラットフォーム、Motianlun成長キャンプ、データベースのローカリゼーション、データベース情報