クラウドネイティブの仮想データ ウェアハウス PieCloudDB データベースのロックを解除する「フェーズ 1」

Tuoshupai の主力製品である PieCloudDB は、最先端のデータ ウェアハウス仮想化テクノロジーを採用し、企業向けに高セキュリティ、高信頼性、高度なオンラインの「強固な」クラウドネイティブ仮想データ ウェアハウスを構築します。このシリーズの記事では、PieCloudDB Database の最新の開発と新機能を紹介します。

関連動画:リンク

製品トライアル: https://app.pieclouddb.com

コンピューティング リソースとネットワーク リソースが豊富にあるため、コンピューティング プラットフォームは、メインフレーム時代、PC 時代、そして今日のクラウド時代に至るまで、3 世代にわたるプラットフォームの変化を経験してきました。3 番目の変革では、サーバー仮想化技術の進歩により、クラウド コンピューティングの時代が到来しました。 

3 世代にわたるコンピューティング プラットフォームの変化 

クラウドによってもたらされる恩恵を最大限に活用するために、Tuoshupai はクラウド時代の新しいデータベース管理プラットフォームである PieCloudDB を作成しました。PieCloudDB は、ユーザー データ、メタデータ、コンピューティング エンジンの 3 つの論理コア コンポーネントを分解し、クラウド上で再構築します。このストレージとコンピューティングの分離アーキテクチャは、クラウド上で高い弾力性をもたらし、高い耐障害性と、ソフトウェアとハ​​ードウェアを分離する高いオンライン機能を備えています。ユーザーは、自分のニーズに応じて、オンデマンドでストレージやコンピューティング リソースを柔軟に拡張できます。

データ ウェアハウスのクラウドネイティブ仮想化テクノロジーの画期的な進歩がデータ コンピューティングの時代をリード 

2022 年 10 月 24 日以降、Tuosupai は PieCloudDB コミュニティ エディション、エンタープライズ エディション、オールインワン バージョンを連続してリリースしました。3 月 14 日の π デーに、Tuosupai は PieCloudDB の新バージョン、Cloud on Cloud をリリースしました。これまで、PieCloudDB はベア ハードウェア、プライベート クラウド、パブリック クラウドの 3 つの導入方法を完全にサポートしてきました。 

PieCloudDBのさまざまな導入方法 

新しいバージョンでは、PieCloudDB はデータ ウェアハウスのクラウド仮想化を完全に実現しますクラウド ネイティブ データ ウェアハウス仮想化は、従来の MPP データベースの多くのボトルネックを突破し、クラウド上で新しい eMPP アーキテクチャを実現し、複数のクラウド ネイティブ仮想データ ウェアハウスの同時実行を可能にします。データアイランドの破壊、第 2 レベルの拡張と縮小、リソースの動的な割り当て、オンデマンドの支払いなど、クラウド上の新しいアーキテクチャによって提供される多くの利益を得るために。

PieCloudDB はクラウド上に eMPP アーキテクチャを実装します 

新しいバージョンは多くの新機能を実装し、あらゆる面でパフォーマンスと安定性が向上し、 PieCloudDB を真に「壊れない」強固なものにしています。 

  • 集計プッシュダウン機能が強化されました 

データベースの分析シナリオでは、多くの場合、多数の集計操作が行われます。PieCloudDB が実装する集計プッシュダウン機能は、接続操作の前に実行される集計操作をプッシュすることで、接続操作で処理するデータ量を大幅に削減し、クエリのパフォーマンスを大幅に向上させることができます。 

テスト後、集約プッシュダウンにより、一部の複雑なクエリ アプリケーション シナリオでは、PieCloudDB がほぼ 100 倍、さらには 1000 倍も改善されました。 

集約プッシュダウン関数 

  • ブロックファイルスキップの最適化

PieCloudDBのユーザーデータは、行と列が混在したデータ形式でオブジェクトストレージに保存されます。同時に、PieCloudDB はブロック ファイルをストレージ ユニットとして使用します。ブロック ファイルは、効率的な圧縮を実現し、ストレージ スペースを節約するために列に格納されます。新しいバージョンの PieCloudDB に実装されたブロック ファイル スキッピング最適化メカニズムは、データベースがクエリ ステートメントを実行するときに各ブロック ファイルの列集計情報を事前に計算し、クエリ ステートメントを実行します。不要なデータ ブロックがスキップされるため、読み取られるデータ量が削減され、クエリのパフォーマンスが向上します。 

PieCloudDB 行と列の混合ストレージ 

  • 極めて高速な分析を実現 

「分析」操作は、データベース テーブルの内容を分析し、各テーブルの各列の値の分布に関する統計を収集します。データベース クエリ エンジンはこれらの統計を使用して、最適なクエリ プランを生成します。 

ほとんどのデータベース システムでは、分析は手動で実行されるか、AUTO VACUUM によって自動的に実行されることが多く、大量のデータを含む大きなテーブルに対するクエリには時間がかかりすぎます。 

新しいバージョンでは、PieCloudDB は非常に高速な分析を実装しており、データが変更されたときに自動的に分析を完了し、より正確なクエリ プランニング統計をタイムリーに生成できます。

  • 新しいキャッシュメカニズム 

メタデータに関しては、PieCloudDB はメタデータ レイヤーに新しいキャッシュ メカニズムを実装します。これにより、メタデータ サーバーへのアクセスによって生じるネットワーク通信のオーバーヘッドとメタデータ サーバーの負荷が効果的に削減され、メタデータ アクセスの速度が向上します。  

  • 高速ETL/ELTおよび外部データソースのクエリをサポート 

新しいバージョンでは、PieCloudDB は Kafka ストリーミング データのインポートをネイティブにサポートします。コピー操作は元の単一ノードからクラスター全体へ最適化され、クラスターのサイズに比例してパフォーマンスが大幅に向上します。 

さらに、新しいバージョンでは、PieCloudDB が外部データ ラッパー モジュールをサポートし、ユーザーが HDFS、MySQL などを含む (ただしこれらに限定されない) データ ソースにアクセスできるようになります。同時に、PieCloudDB は、ユーザーが新しいストレージ データ ソースにアクセスするためのモジュールを開発することをサポートします。 

これら 5 つの主要な最適化に加えて、PieCloudDB の新しいバージョンのカーネルには次の機能も実装されています。 

  • 可観測性の向上
  • 真空の最適化
  • HDFS/NAS システムでネイティブ ストレージ形式をサポート
  • オープンソースのオプティマイザー Orca のサポート
  • オープンソースの機械学習ライブラリ Madlib のサポート
  • 非常に大きなデータ量のフィールドのサポート

…。 

その他多くの最適化。

PieCloudDB は、新しいストレージ エンジン JANM を作成しました。Jianmo は、PieCloudDB の行と列の混合ストレージのストレージ形式を生き生きと説明している「Bamboo Slips and Ink Book」から来ています。 

PieCloudDB の新しいバージョンでは、ストレージ エンジン JANM が以下を実装します。 

  • JANM分散処理の強化 
  • JANM はファイルを動的に割り当てて読み取り、ディスパッチのパフォーマンスを向上させます 
  • JANM例外処理の最適化 

…。 

など多くの機能があります。

PieCloudDB クラウドネイティブの管理および制御プラットフォームは、以下を含めて完成しました。 

  • ユーザー権限の最適化 
  • 登録オプションが追加されました 
  • データ洞察の最適化 
  • データインポートの最適化 
  • 外部アクセスはより多くのタイプをサポートします 

…。 

その他多くの最適化。

PieCloudDB は引き続き反復して前進します。https: //app.pieclouddb.comにアクセスして、クラウド オン クラウド バージョンを試してください。また、QR コードをスキャンして技術コミュニティに参加し、一緒に作業できることを楽しみにしています。

おすすめ

転載: blog.csdn.net/OpenPie/article/details/130286454