【ペーパーノート】ブロックチェーンのインセンティブ制度に関するペーパーノート

コンソーシアムブロックチェーンにおけるレピュテーションベースのインセンティブメカニズムを備えたレコメンデーションスキーム

1. この記事で解決すべき主な問題と解決策:

1) 解決すべき問題

現在のレコメンデーション エンジンは通常、集中型サーバー上に構築されています。このアーキテクチャは脆弱であり、プライバシーを危険にさらします。したがって、推奨システムのプライバシー保護の問題を解決するには、新しい分散型アーキテクチャ モデルが必要です。
前回の記事でも使用しました
が、非中央集権的なレコメンデーション システムは、非アクティブな参加やノードの悪意のある動作など、いくつかの問題に直面しています。これらの問題は、推薦結果の精度や推薦システムの有効性に大きく影響します。したがって、この記事では、参加者の推奨事項の信頼性と積極的な参加を確保するためのインセンティブ メカニズムを設計します。

2) 記事の主な仕事

1. アライアンスブロックチェーンに基づくレコメンデーションスキームの提案
2. 評判ベースのインセンティブメカニズムの導入
3. スタッケルバーグゲームの使用

スタッケルバーグ ゲームのプラットフォーム中心のメカニズムは、プラットフォームがユーザーの支払総額を完全に制御しており、ユーザーはシステムに参加する戦略を調整することによってのみ収入を増やすことができると想定しています。

私たちのレコメンデーション モデルは Stackelberg ゲーム モデルに似ていますが、リーダーと複数のフォロワーで構成されています。推奨スキームでは、システムがリーダーであり、ポリシーを策定できます。参加者はフォロワーであり、ユーザーとしてレコメンデーション リクエストを送信したり、レコメンダーとして選択してリーダーの戦略に従ってレコメンデーションを行うことができます。

評判インセンティブメカニズムに基づくアライアンスブロックチェーンレコメンデーションスキームは、アライアンスブロックチェーンの監査可能性と透明性を使用して、レコメンデーションシステムの信頼性を高めます。

2. システムの枠組み設計

ここに画像の説明を挿入
初期段階
複数の組織が力を合わせてブロックチェーン ネットワークを構築できます。
コンソーシアム ブロックチェーンの認証と承認の後、組織の参加者はノードとしてブロックチェーン ネットワークに参加し、推奨されるトランザクションを実行できます。
始める
システム プラットフォームは、ユーザーが提出したタスクをブロックチェーン ネットワークに発行します。
レピュテーション インセンティブ メカニズムにより、より多くのノードが推奨に参加するようになります。
参加ノードの数がシステムによって指定された最小数を超えると、システムは推奨を実行します。
終了
最後に、システムは推薦結果をユーザーに返し、参加ノードに報酬を分配します。悪意のあるノードは処罰されます。

3. 評判インセンティブメカニズム

インセンティブ

ここに画像の説明を挿入
R はすべての参加者の総報酬、α は推奨に必要な参加ノードのしきい値、D はデポジットです。

ノードの評判評価

新しいノードに入金メカニズムを提供して、クレジットを迅速に増やします。預金が多いほど、信用度が高くなります。
ここに画像の説明を挿入

報酬分配

レコメンデーション スキームは 2 つのロールで構成されます。1 つはリソースを推薦し、一定の預金 Di を支払い、推薦を完了すると報酬を受け取る参加者であり、もう 1 つは推薦を投稿し、すべての参加者に一定の報酬 R を支払うユーザーです。

信頼できるノードの定義:
同盟ノードの評判値 T がクレジットしきい値 α を超える場合、それは信頼できるノードであり、そのノードは悪意のあるアクターです。
ここに画像の説明を挿入

レコメンドシステムの設計と実装

複数の教育機関を統合して、教育同盟ブロックチェーンを形成しています。システムは Fabric 開発環境に基づいており、オペレーティング システムは Ubuntu 64 ビット システムを使用します。フロントエンド システムは、スマート コントラクトを操作するための視覚的なインターフェイスをユーザーに提供し、RESTful API を呼び出してシステム機能を実現することでバックグラウンド プロセスと通信します。

ユーザーは、一般ユーザーと共同ノード ユーザーに分けられます。

デポジット部分は、通常、未完了の推奨タスクのデポジットと、ノードによる悪意のある推奨のために差し引かれたデポジットを含む、未返却のデポジットです。残りの部分は、紹介を通じて獲得したボーナスです。ユーザーは、参加ノードのさまざまなパフォーマンスに応じて、さまざまな金額の報酬資金を参加者の残高口座に送金します。

ここに画像の説明を挿入

4. セキュリティとパフォーマンスの分析

共謀防止分析

ここに画像の説明を挿入

システムの堅牢性分析

ブロックチェーンの利点により、そのようなリスクはありません。

性能試験

ここに画像の説明を挿入
図から明らかなように、インセンティブを導入すると、推薦システムの各ラウンドの参加者数が大幅に増加します。次に、推奨結果の精度を向上させるために十分な数の参加者を確保するためのしきい値を設定する方法を検討します。したがって、さまざまなしきい値の下での推奨結果について、ユーザー満足度のシミュレーション分析を行います。α を 50 70 90 とします。図 6 に示すように、参加者数が増えると推薦結果に対するユーザーの満足度も高くなり、参加者数がしきい値に達すると、より正確な推薦結果が得られるため、ユーザー満足度が高くなります。したがって、インセンティブメカニズムを設計する際には、参加者の数がしきい値を超えるようにする必要があります。

最後に、最適推奨インセンティブ メカニズム (ORIM) とリバース オークション ベースの動的価格設定メカニズム、仮想参加クレジット (RADP-VPC) インセンティブ メカニズム、および評判ベースの参加型インセンティブ メカニズム (RPIM) のシステム インセンティブ オーバーヘッドを比較します。

ここに画像の説明を挿入

共謀の場合のシステム インセンティブ オーバーヘッド実験の結果を図 8 に示します。共謀がある場合、RADP-VPC のシステム インセンティブ オーバーヘッドが急激に増加することから、このメカニズムでは悪意のある共謀を防ぐことができないことがわかります。RPIM のシステム インセンティブ料金はゆっくりと着実に増加しており、この仕組みがシステムの公平性をある程度保証できることを示しています。ORIM のシステム インセンティブ コストは比較的安定しており、このメカニズムによってシステムの公平性が保証され、システム インセンティブ コストが低く抑えられていることがわかります。

信頼できるフェデレーテッド ラーニングのインセンティブ メカニズム: 評判と契約理論を組み合わせた共同最適化アプローチ

マルチウェイトの主観的ロジスティックモデルを使用して、堅牢な連合学習のための評判ベースの労働者選択スキームを設計します。ブロックチェーンを活用して、否認防止と改ざん防止の特性を持つ従業員の安全な評判管理を分散型の方法で実現します。さらに、評判と契約理論を組み合わせた効果的なインセンティブ メカニズムが提案され、評判の高いモバイル デバイスが高品質のデータを使用してモデル学習に参加するように動機付けられます。

なぜインセンティブが必要なのですか?

1. 信頼できない従業員は、トレーニングを誤解させるために悪い行動をする可能性があります。意図的な動作の場合、ワーカー スレッドがポイズニング攻撃を開始し、悪意のある更新を送信してグローバル モデル パラメーターに影響を与え、現在の共同学習メカニズムが失敗する可能性があります。
2. セルフサービス型のモバイル デバイスは、適切に設計された金銭的補償がなければモデル トレーニングに参加することに消極的です。

システム構成

ステップ 1 (共同学習タスクと契約項目の発行)
各タスク発行者は、特定のリソース要件があることをモバイル デバイスにブロードキャストします。要件を満たすモバイル デバイスは、連合学習タスクに参加するための補助ロールをトレーニングするための候補モデルになることができ、リソース情報を含む応答をタスク発行者にフィードバックすることもできます。
ステップ 2 (候補者の評判を計算する)
ステップ 3 (フェデレーテッド ラーニングのワーカーを選択する)
ステップ 4 (フェデレーテッド ラーニングを実行し、ローカル モデル更新の品質を評価する)

レピュテーションデザイン

このセクションでは、主観的なロジスティック モデルを適用して、労働者候補の総合的な評判値を生成します。

ブロックチェーンを使用してフェデレーテッド ラーニングの貢献を記録し、報酬を与える

既存の問題

フェデレーテッド ラーニングでは、参加者はローカル データを公開せずにローカル データを提供できますが、データ セキュリティと、高品質のデータ提供に対する参加者への正確な支払いに問題があります。

解決した問題

トランザクション手数料のないパブリック ブロックチェーンは、ユーザーにそれを使用するインセンティブをさらに与えます。

信頼できるフェデレーテッド ラーニングのインセンティブ メカニズム: 評判と契約理論を組み合わせた共同最適化アプローチ

過去の対話から生成された直接的な評判の意見と、他のタスク発行者の間接的な評判の意見は、ワーカー選択のための総合的な評判に統合されます。

ゲームに参加している顧客の応答行動は、スタッケルバーグ ゲームのソリューションを通じて分析され、提案されたフレームワークの有効性はケース スタディを通じて確立されます。

おすすめ

転載: blog.csdn.net/weixin_45322676/article/details/123747789