データ駆動型ピアツーピア ストリーミングのスループットを最適化する論文 読書ノート
ペーパーリンク
http://ieeexplore.ieee.org/document/4509427
この文書で解決したい問題を読んでください
P2P では、特定のブロックがどのノードからダウンロードされるかを決定します。
ブロック: ビデオ ファイルは送信のために小さな部分に分割されます。この小さな部分がブロック
ノード: ユーザーです。全員が同時に同じビデオを視聴すると、ビデオ データを共有できます。このとき、全員は互いにピア ツー ピアです。全員が
同じビデオを視聴すると、ビデオ データ ファイルを互いに共有します。ダウンロードを高速化します。コンピュータ上の他のファイルには影響せず、ましてやプライバシーに関する声明が漏洩することはなく、現在視聴しているビデオのデータのみを共有し、共有できるだけです。
どのブロックがどのノードにダウンロードされるかという問題を解決する必要があるのはなぜでしょうか?
- 再生の進行状況は人それぞれ異なるため、再生ポイントに最も近いビデオ データを優先する必要があります。
- キャッシュされたビデオの長さは人によって異なります
- ネットワークの状態は人それぞれ異なります
- 特定のノードが大量のデータをキャッシュしているにもかかわらず、ネットワーク状態が良好なノードからのデータを要求し続ける状況が発生する可能性があります。ここでのこのノードは、実際にはネットワーク状態が悪いノードからデータを要求することができ、ネットワーク状態が良好なノードがキャッシュ データの少ない他のノードにデータを提供できるようになります。
- データ共有速度を最大化し、通信事業者の帯域幅コストを節約することが期待できます。
ノート
- この論文は、グローバル ビットマップ情報と帯域幅の上限がわかっている場合、問題を最小コスト フロー問題に変換でき、最適な解決策が存在することを提案しています。
- しかし実際には、ノードにとってグローバルな情報を知ることはできません。接続されているノードのビットマップ情報と帯域幅情報しか知らないため、この場合、グリーディまたは LRF を使用することは最適な解決策ではありません。
- LRF: 地元で最もレアなものを優先し、希少性を優先します。最も少ないブロック、つまり接続されているすべてのノードの中で、特定のブロックを持つノードを数え、最も小さい番号のブロックを優先することで、希少なデータをできるだけ早く拡散しようとする考えです。
- 大域最適を知ることは不可能であり、論文ではヒューリスティック分散アルゴリズムが提案されていますが、これ以降は完全に理解できず、以降はすべて推測になります。
- ここで提案されているのは、2 つのノード間で送信する最適なデータ量を決定し、LRF を使用するというものです (本来は希少性に加えて、再生ポイントへの近さという要素も考慮する必要がありますが、どうやら希少性のみを考慮する必要があることが実験データによって証明されています)、それは全体最適に近い可能性があります。2つのノード間で送信される最適なデータ量を決定する問題では、最近の平均速度の数倍がかかります。
混乱
- なぜ以前の速度を送信する最適なデータ量として捉えることができるのでしょうか? この論文では、
This is because the data-driven protocol has the inherent ability to allocate the traffic to each neighbor and make full utilize of all bandwidths from every neighbor.
データ駆動型プロトコルには、帯域幅の使用率を最大化するソリューションを割り当てる機能があると記載されています。 - データ駆動型プロトコルとは何ですか? どうやらBTプロトコルのようです...
- ノード A が最初に B にデータを提供すると、次に C が入ってきて、A が C にデータを提供したいと考えます。では、C はどのようにして B から帯域幅を獲得できるでしょうか?
- この論文は上記の質問に答えているようには見えませんが、データ駆動型プロトコルが上記の問題を解決できると述べているだけであり (しかし本当に可能でしょうか? どうすればよいのでしょうか?)、ノードがどれだけのデータをリクエストする必要があるかを計算しています。各リクエストの接続されたノードのデータ量は、このデータ量によって制限されます (このデータ量以上、以上ではなく、このデータ量と等しい)。再度 LRF を実行すると、グローバル最適値に近づくことができます。 。
結論は
答えられない場合、なぜデータ駆動型プロトコルで帯域幅を最大化できるのでしょうか? あるいはそれをどうするかということについては、この論文を読んでも何の参考にもなりません。工学系の論文を読むのは初めてなのですが、なかなかうまくいきません…。