チェーンパドル PaddleDTXシリーズ 基本コンセプト紹介

PaddleDTX には、ブロックチェーン、分散型ストレージ、プライバシー コンピューティングの 3 つの重要なモジュールが含まれています.その動作原理を理解するには、いくつかの基本的な概念を理解する必要があります.

1. ブロックチェーンに関する概念

ブロックチェーン: ブロックチェーンは新しいタイプの分散型データベースとして理解することができます. ネットワーク全体が特定のコンセンサスメカニズム (pow, pos, vrf など) を通じて元帳とトランザクションのステータスに同意します. ブロックチェーンはハッシュなどのパスワードを使用します.このメカニズムにより、チェーン上のデータが改ざんできないことが保証されます。すべてのブロックチェーン フル ノードは、ブロックチェーンの完全なデータ情報を保存します。一方がデータを改ざんしても、他のノードには認識されません。PaddleDTX は、基盤となるブロックチェーン アーキテクチャとして XuperChain と Fabric をサポートしています。

スマート コントラクト: スマート コントラクトは、ブロックチェーン上で実行されるコンピューター プロトコルであり、情報を提供する方法でコントラクトを配布、検証、または実施するように設計されています。PaddleDTX におけるノードの分散型ガバナンス、データのコピーを保持するための証明メカニズム、およびコンピューティング タスクの管理はすべて、スマート コントラクトに基づいています。

2. 分散ストレージに関する概念

PaddleDTX のストレージ ネットワークには、主に 3 種類のノードがあります。

  • データ保持ノード: データを保存する必要があるデータの所有者。
  • ストレージ ノード: アイドル状態のストレージ リソースが豊富にあり、ストレージ サービスを提供できます。
  • ブロックチェーン ノード: ブロックチェーン ネットワークを構成し、異なるブロックチェーン フレームワークに基づいており、異なる定義を持っています。

コピー保存の証明: ファイルがストレージ ノードによって安全に保存され、改ざんされていないことを保証するために、PaddleDTX はコピー保存証明のチャレンジ アンド レスポンス メカニズムを採用しています。データ所有者は定期的にストレージ ノードにデータの完全性証明チャレンジを開始し、ストレージ ノードはチャレンジに応答します.プロセス全体がブロックチェーンに記録され、スマート コントラクトによって自動的に検証されます.

ファイルの移行: ファイルのセキュリティと高可用性を確保するために、データ ホルダーは自身のファイルのヘルス ステータスを定期的にチェックし、異常なファイル スライスを異常なストレージ ノードから正常なノードに移行して、各ファイルが正常で A であることを確認します。いつでも元に戻せる状態。

正常性: PaddleDTX は、ストレージ ノードとファイルの正常性ステータスの監視をサポートし、システムの高可用性を確保します。

  • ストレージ ノードのヘルス ステータス: ストレージ ノードのヘルス ステータスは、ノードのアクティビティとレプリカ メンテナンス証明書応答の成功率に従って測定されます. ファイルが配布されると、正常なストレージ ノードが最初に選択されます;
  • ファイルの正常性ステータス: ファイルの正常性ステータスは、各スライスの正常性ステータスに従って測定され、各スライスの正常性ステータスは、それが存在するストレージ ノードの正常性ステータスによって決定されます。

3. プライバシー コンピューティングに関する概念

PaddleDTX のコンピューティング ネットワークには、主に 3 種類のノードがあります。

  • コンピューティング需要ノード: トレーニング モデルと予測のニーズがあります。
  • タスク実行ノード: データを使用する権限を持ち、マルチパーティ セキュリティ計算に参加し、モデル トレーニングとデータ予測を実行します。
  • ブロックチェーン ノード: ブロックチェーン ネットワークを構成し、異なるブロックチェーン フレームワークに基づいており、異なる定義を持っています。

PaddleDTX ネットワークには 2 つのコンピューティング タスクがあります。

  • モデル トレーニング タスク: トレーニングを通じてターゲット モデルを取得します。
  • 予測タスク: 予測によってデータの目標値を取得します。

モデル評価: PaddleDTX は、トレーニング済みモデル効果の分散評価をサポートし、動的評価と静的評価の 2 つのモードをサポートします

  • 動的モデル評価: 動的評価はトレーニング タスクと同時に実行され、指定されたトレーニング ステージでモデル評価をトリガーし、現在のトレーニング ステージが終了した後に評価指標を取得します。トレーニング プロセス中、各段階でのモデルの評価結果を取得して、トレーニングを終了するかどうかを決定できます。トレーニング タスクの最後に、一連の評価指標を取得して、トレーニング効果の変化傾向を示すことができます。 . PaddleDTX は、ランダム パーティションの動的モデル評価方法をサポートしています。
  • 静的モデル評価: 静的評価はトレーニング タスクの後に実行されます. 評価者はトレーニング サンプルを分割し、トレーニング タスクと対応する予測タスクを作成して実行し、最終的に評価指標を計算します. PaddleDTX は、3 つの静的評価方法をサポートしています: ランダム パーティション、クロス検証、および Leave-One-Out 方法です。

データセット: PaddleDTX のトレーニング サンプルと予測データ セットは、集中型ストレージ ネットワークにファイルの形式で保存され、トレーニング タスクまたは予測タスクを発行するときにコンピューティング デマンド ノードによって指定されます。

PaddleDTX は、次の 3 つの機械学習アルゴリズムをオープンソース化しています。

  • 多重線形回帰: 多重線形回帰は、変数が複数の要因の影響を受けることを説明するために使用され、それらの関係は複数の線形方程式で表すことができます。
  • 多重ロジスティック回帰: 多重ロジスティック回帰モデルは、線形回帰モデルの変更に基づいて取得されます. 多重線形回帰とは異なり、多重ロジスティック回帰のターゲット特徴量は離散的であり、通常 {1,0} として定義されます。ターゲット機能は指定された値です。
  • ニューラル ネットワーク: ニューラル ネットワークは、相互に接続された多数のノード (またはニューロンと呼ばれる) で構成される運用モデルであり、理論的には任意の関数を近似できます。

PaddleDTX は 3 つのアルゴリズムすべてに対して垂直連合学習の変換を実行しており、当面は水平連合学習をサポートしていません。

  • 垂直連合学習: 参加者はサンプルの重複が多く、機能の重複が少ない。サンプルを垂直に分割し、同じサンプルで異なる特性を持つデータの一部をトレーニング用に取り出します。
  • 水平方向の連合学習: 参加者の特性はより多く重なり合い、サンプルはより少なく重なります。サンプルを横に分割し、特徴が同じでサンプルが異なるデータの部分を取り出して学習します。

おすすめ

転載: blog.csdn.net/weixin_40862140/article/details/126428086