新しいムーアの法則の下でコンピューティング電力分配ネットワークを構築する

ムーアの法則は、Intel の創設者の 1 人であるゴードン ムーアによって 1965 年に最初に提案されました。彼は、集積回路に収容できるトランジスタの数は、18 ~ 24 か月ごとに約 2 倍になると考えていました。それから 20 年が経過した現在、変化し続ける社会と急速に進化するデジタル ニーズに直面して、ムーアの法則もまた、社会の進歩とともに新しい定義が与えられています。LiveVideoStackCon 2022 北京駅は、Wangxin Technology の CEO である Li Hao 氏を招待し、新しいムーアの法則に基づいてコンピューティング電力分配ネットワークを構築する方法を共有してもらいました。

テキスト/リー・ハオ

編集/LiveVideoStack

今日の私のスピーチのトピックは、「新しいムーアの法則の下でコンピューティング電力分配ネットワークを構築する」です。

b7a939da206cb7525a96771b8a0323d0.jpeg

1. コンピューティング パワーの特異点とオーディオおよびビデオ コンテンツへの影響

38d5c4a184228ad5917f8cbeb6bb36d9.jpeg

狭義のムーアの法則は、チップ、ウェーハ、および密度を指します。さて、ムーアの法則がすべてです。サム・アルトマンは物議を醸すトピックをツイートしました - 宇宙の知性は18ヶ月ごとに2倍になります. 宇宙のエージェントに関する私の個人的な理解は、AI の計算能力です。右の写真は、有名な社会学者レイ・カーツワイルが 2005 年に出版した本の挿絵です。タイミングが意外と合います。2020年頃はマウスのIQに相当し、現在GPT-4の接続数は約1兆。人間には約 170 兆のニューロン接続があります。1兆はげっ歯類のレベルで、代表的なのはリスです。ムーアの法則によると、GPT-4 は 20 年で人間のレベルに達することができます。しかし、GPT-3.5からGPT-4までの速度で計算すると、わずか2年しかかかりません。170兆を超えた先、どのような社会変化が起こるかは誰にもわかりません。私たちは今、歴史的な大きな転換点にいます。

e90e4486d887baebfb920b29cb3db0b8.jpeg

大規模なモデルには、成長が対数曲線に従うスケーリング則があります。モデル パラメーターは指数関数的に増加し、モデルのパフォーマンスは直線的に増加します。このような考え方から、モデルが人間レベルの行動知能に到達するにはまだほど遠いと考えています。

しかし、100億を超えると、急速に成長する相転移曲線が発見され、創発能力が現れる。これは OpenAI の人類への最大の貢献であり、大規模モデルへの道を反復することの実現可能性を証明していると思います。モデルが大きいほど、パフォーマンスが速く向上します。

7180d24ca2f0ba6e5f9853de652e3792.jpeg

以下では、クラウド コンピューティング業界について簡単に紹介します。クラウド コンピューティングが最初に開始された 2010 年頃、チームはその見通しについて議論しましたが、クラウド コンピューティングは次の 3 つの段階に分けられると考えています。

最初の段階はリソース次元で、マシン、DB、ネットワーク、ストレージを自分でマスターして、独自のサービスを構築する必要があります。

2 番目のステージはサーバーレス ステージで、コードでスケジュールするだけでよく、より開発者向けです。ネットワークとサービスが成熟すると、ユーザー指向の第 3 段階に入ります。

ただし、第 3 ステージの形状はより複雑で使いにくく、結果については議論されていません。しかし、大きなモデルが現れると、すべてが解決しやすくなり、自然言語が最善の方法になります。モデルが自然言語をよく理解すると、コンピューティング パワーのスケジューリング ロジックは一般的なものになります。これは、クラウド コンピューティング業界全体にとって大きなブレークスルーとなるでしょう。

137d6913a901ba1f5a5d797073608a2e.jpeg

オーディオおよびビデオ業界に関する限り、それがインテリジェントなダビングであろうと、AI プレゼンテーション ビデオの生成であろうと、アイデアとコピーライティングを完全に考案し、複製とインテリジェントなダビングを行い、最終的にいくつかのビデオを生成することができます. 完了するのに半日しかかかりません.セット全体。チーム全体で 1 週間かかるのに比べて、非専門家は半日で完了することができ、生産性が大幅に向上します。

従来の音声・動画コンテンツは、端末で生成され、クラウドで処理された後、他の視聴者に配信されます。中間プロセスは単純明快です。AGIを持つと、全体として処理する必要があるコンテンツが増えます。多くの人が「ハリケーン」を見ていると仮定すると、テレビシリーズを私に配信する過程で私の好みに応じていくつかの変更が加えられるため、その計算能力の増加は避けられません. エッジ側とクラウドで生成されるデータが増えることで、コンテンツの制作と配信のソースにも変化がもたらされます。

c11b2f6a5cdb33c7bd05acb3a2da82fd.jpeg

左の図は2020年のIDCの予測ですが、そのデータは比較的保守的だと思います.2025年にはデータの大部分がコアとエッジに保存され、80%をはるかに超えます. 将来的には間違いなく新しい機会があり、個人データ ノードでは、人工知能の出現により社会のデジタル化が加速し、個人データは最大のプライバシー資産になります。

2. エッジ クラウドが新しいデータ ソースになり、構造変化を引き起こす

9ff89e8503faf84b6b4999095a25cbbc.jpeg

エッジ クラウドは新しいデータ ソースになり、新たなアーキテクチャの変更のきっかけにもなると思います。データ コンピューティングの需要が高まるにつれて、コンピューティングは端末で完了することが難しくなり、エッジとクラウドでしか実行できなくなります。需要の増加に伴い、エッジ端末の速度は速く、コストは低く、これはクラウドの優れた補完になるはずです。クラウドとエッジが一緒になって、一般化されたクラウド コンピューティング ネットワークを構築します。これは、将来的にデータ生成とデータ コンピューティングのほとんどを引き受けることになります。ユーザーは、パーソナライズされたデータを生成するために小さなサンプルのみを必要とし、一部のローカライズされたツールもクラウドベースである必要があります。現在、Adobe を含む企業はすでにそれを開始しています。

ba0eb862427fc41542338c47a37a89b8.jpeg

機会と課題は常に共存しています。技術的な観点から見ると、従来のネットワーク構造では、エクスプレス小包のように小さくて細かい領域に分割でき、ほとんど区別されません。しかし、計算能力が重なると、その差は非常に大きくなります。GPT-4 のパラメータ ボリュームは 6000 億から 1 兆の間である可能性があり、ロードするには 1T 以上のビデオ メモリが必要ですが、一部の小さなモデルは数 G でロードできます。一部のものはアトミックに分割できず、複雑な分散につながり、要件に応じて分割を調整する必要があります。ここでは iResearch Consulting のレポートを引用して、コンピューティング パワー ネットワークの 3 つの主要な要素を説明します。

コンピューティング パワー ネットワークには、次の 3 つの主要な要素があります。

(1) コンピューティング: コンピューティング パワー ネットワークのコア リソース。

(2) 認識: 特定のシナリオにおける計算能力要件の認識、および計算能力リソースの認識。

(3) 接続: 分散型、異種、マルチレベル、およびアイドル状態のコンピューティング パワーを収集します。

上記の 3 つの要素は、コンピューティング パワー ネットワークに機能属性とサービス属性を付与し、社会全体のコンピューティング パワー リソースを効率的に活性化し、産業用アプリケーションに力を与えることができます。コンピューティングパワーネットワークの技術アーキテクチャの観点から、下から順に、基本リソース層、コンピューティングネットワークスケジューリング層、コンピューティングネットワーク操作層に分けることができ、同時に、コンピューティングネットワークの運用と保守、およびコンピューティングネットワークのセキュリティを実現します。全工程を経て、「横三本、縦二本」の支持体を形成する。最終的に、コンピューティング パワー ネットワークは、製品または機能の形で産業用アプリケーションを強化します。

5eeb5137371e5c02dbb7a25b93983dc8.jpeg

今後、エッジ側のコンテンツ制作工程が多くなります。デジタルヒューマン、特殊効果などを含むいくつかのソースデータを重ね合わせるだけで、エッジ側で生成できます。配信される画像は、遅延要件が厳しいため、エッジ側でのみ生成できます。

b3ea6768de13e8fe155777b35f2b4434.jpeg

2 つ目は、リアルタイムのやり取りが増えることです。ローカライズされた対話の多くは、クラウドとの対話になります。現在、最も要求の厳しいクラウド インタラクションは、RTC シーンのビデオ ダイアログです。次に考えられるシナリオは、クラウド ゲームです。クラウド ゲームのインタラクションに必要な遅延はビデオの半分であり、100 ミリ秒を超えることはできず、10 ミリ秒以内に仮想現実が続きます。進化に伴い、ネットワーク分散コンピューティング能力の安定性に対する要件はますます厳しくなり、エッジ側の分散には超低遅延の能力が必要です。

e6aededcf10b3f74e8550863947bf7d1.jpeg

最後に、ビジネス ロジックも増加します。データ ソースが変更されると、すべてのデータ ロジックを書き直す必要があります。これとクラウド コンピューティングの最大の違いは、複雑すぎるリソースの観点からエッジを動員できないことです。そのため、エッジ側がコアとしてサービスを受け、サーバレスをベースにビジネスロジックを再構築する必要があります。

3. Wangxin オーディオおよびビデオ サービス アーキテクチャの進化

Wangxin は、上記のさまざまな問題に対処するために多くの試みを行ってきました。また、将来のコンピューティング能力に基づいた製品を発売し、オーディオとビデオの顧客に十分なサービスを提供しています。したがって、私たちの価値は、より低いレイテンシー、より優れた安価なコンピューティング能力、およびより便利な運用サービスを顧客に提供する方法に重点を置いています。

Wangxin Technology について簡単に紹介します。Wangxin Technology は、中国で最も初期のクラウド コンピューティング企業であり、世界最大かつ最も沈み込んでいるエッジ ネットワーク オペレーターでもあります。Wangxin のコンセプトは、エッジ クラウド コンピューティングはプラットフォーム モデルでなければならないというものです。自己建設、共同建設、共同建設のいずれであっても、マルチレベルの断片化されたリソースを効率的に統合すると同時に、技術的なサブアセンブリを実現し、外部インターフェイスを標準化し、業界の顧客に適切にサービスを提供する必要があります。現在、Wangxin の主なサービス ターゲットはオーディオおよびビデオ業界の大手企業であり、AI や超低遅延などのシナリオにも展開されています。現在、Wangxin のエッジ ノード数は 500 万を超え、独自の SDK を通じて 6 億人を超える中国のユーザーをカバーしています。

まず、エッジでアイドル状態のホストを使用して構築したクラウド ゲーム エクスペリエンスを見てみましょう.全体的な画面エクスペリエンスと遅延は、ゲームのニーズを完全に満たすことができます.

b3880f5540ea43cea2ec532ac4b00e6c.jpeg

従来のメーカーと比較して、Netcenter のクラウド ゲーム アーキテクチャの最大の違いは、カバレッジ密度の高いエッジ側ノードを使用していることです。中央のクラウドを使用してクラウド ゲームを作成すると、コストが制御不能になるだけでなく、遅延も非常に大きくなり、70 ミリ秒未満のエクスペリエンスを実現することは不可能です。構築されたエッジ ネットワークを通じて、ユーザーに最も近いノードを見つけて、レンダリングとストリーミングのエクスペリエンスを最適化します。

Wangxin は、いくつかの技術革新ポイントを提案しました。1 つ目はエッジ ネットワークに固有のもので、多数のエッジ ノードがあるため、ネットワークの状態を明確に認識できますが、これは多くのクラウド コンピューティング ベンダーにとって困難です。第 2 に、すべてのエンド ツー エンド プロトコルは Wangxin 自身によって作成されます。現在のRTC業界の核心は二重端末相互作用の問題を解決することですが、クラウドゲームは単一端末の超低遅延相互作用であり、高ビットレート、高フレームレート、低遅延がクラウドの3つの基本特性です。ゲーム。ネットワーク コアは、QUIC プロトコルを使用してデータ プレーンとコントロール プレーンを分離します。高ビットレート、高フレームレート、超低遅延に対応して、輻輳制御やRS FECなどの新技術も導入。

上記の革新的な技術に基づいて、利用可能な帯域幅の急速な回復の場合、ネットワークの大量のパケット損失が発生した場合に、理想的な値が 500 ミリ秒以内に回復できることを確認しました。弱いネットワーク パフォーマンスのテスト結果は、OT QUIC が indigo よりも最適なパケット損失と優れた遅延を示すことを示しています。

AIGC テキスト生成の画像シーンを見てみましょう。エッジは主に小さな計算能力に基づいており、このタイプの小さなモデルはエッジで実行するのに非常に適しており、単一タスクでインタラクティブ性の低いアプローチは、エッジのアルゴリズムにより適しています。

659c97b05adcff2815e396b23e232660.jpeg

全体的な AIGC IAAS 構造はあまり変わっていません。Netcenter は、完全なエッジ ネットワーク仮想 GPU コンテナーを構築することができました。大きくてカットが必要なコンテナもあれば、小さくてカットしないコンテナもあります。最終的な分析では、画像生成サービスを使用して共有エッジ ノードを動員する必要があり、これによりコストを大幅に節約できます。

エッジ クラウド コンピューティングが将来のシナリオによりよく対応できるようにするために、Netcent Technology は「3 ステップ」の開発戦略を提案しました。

最初のステップは、コストを削減し、効率を高めることです。現在、経済的利益を生み出すことができるシナリオと顧客の実際のニーズに基づいて、顧客を使用してネットワーク規模を拡大し、ネットワークレベルを改善し、コストを削減し、効率を改善し、企業の健全な拡大を促進しています。

2 番目のステップは機能の反復です。ビジネス シナリオを徐々に充実させ、クラウド ゲーム、AIGC およびその他のビジネスの改善とプロモーションを促進し、コンピューティング パワーのニーズの研究開発とカバーを主張し、コンピューティング パワーのレイアウトと機能を引き続き改善します。

3番目のステップは、エコロジーを構築することです。エッジ ネットワークとコンピューティング パワーの重ね合わせを促進し、産業シナリオを接続し、産業シナリオの製品化を実現します; 車両のインターネットと車両と道路のコラボレーションをエントリ ポイントとして使用して、消費者の顧客のニーズに適応します; オープンなネットワーク プラットフォームを構築して、開発者とパートナーを引き付けてエコシステムを共同で構築します。

今後8年から10年で、3段階の計画が徐々に実現されると確信しています。今年の AGI の急速な発展により、必要な時間が大幅に短縮される可能性があります。

これは今日の私の共有です、ありがとう。


7987e52933f06f1511f180c54a84bc5f.jpeg

LiveVideoStackCon 2023 上海講師募集

LiveVideoStackCon はみんなのステージです. チームや会社の責任者であり、特定の分野や技術で長年の実務経験があり、技術交流に熱心な方は、LiveVideoStackCon の講師として応募してください。スピーチの内容をメール アドレス: [email protected] に送信してください。

おすすめ

転載: blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/130164343