ライブ ブロードキャスト + X - ライブ ブロードキャスト業界の新しいトレンド

  //  

編集後記:人類は常に感動や体験を追求し、音響・映像技術は急速に発展しており、音響・映像サービスはこれまでにない勢いで様々な業界から強く求められています。今やライブブロードキャストは誰もがよく知っている言葉となりましたが、ライブブロードキャストのビジネスとエコロジー、そしてそれを支える主要技術は進化と反復を続け、活力に満ちています。今回の LiveVideoStackCon 2023 上海ステーションでは、Huawei Cloud Lu Zhenyu を招待し、ライブ ブロードキャスト業界で「古い木から新しい芽が生える」方法を共有してもらいました。

文/陸振宇

編集/ライブビデオスタック

皆さんこんにちは、Huawei CloudのLu Zhenyuです。大多数のリスナーの参加感をカバーするだけでなく、誰もが多くのことを得ることができるようにするために、私は主にライブ ブロードキャスト業界の新しいトレンドとゲームプレイを紹介する「Live + X」というテーマを共有することにしました。 。

01

ライブストリーミング業界の動向

3521afd3fa6e6cc275fc6ee9b04e8cdf.jpeg

私たちのチームは、未来を予測したり、未来をできるだけ把握するために、過去を要約してきました。

1. マルチメディア テクノロジー、特にライブ ブロードキャスト テクノロジーは、現在人々が知っている取得、エンコード、送信、再生、およびエンドサイド ライト レンダリングのテクノロジー スタックではありません。ライブ ブロードキャストまたはストリーミング メディアは、複数のテクノロジーの包括的で常に進化するシステムです。 :

取得側の開発:古代人の絵画から、より鮮明な写真、より鮮明で眩しい大ヒット映画の仮想シーン制作技術まで。

映像配信と消費手段の発展:当初はテレビが無線信号を利用して映像を伝送し、その後インターネットが登場し、ライブ映像が登場しました。「ストリーミングメディアライブブロードキャスト」という名前は、現在誰もが認識しているインターネット、カメラコレクション、PCから構成されるテクノロジースタックです。

③エンドツーエンドの開発:シネマTVからPC、携帯電話、各種イマーシブデバイスまで。私の知る限り、チャイナモバイルも裸眼3D産業の発展を推進しており、携帯電話やタブと変わらない画面でいつでもコンテンツを裸眼3Dに変換でき、その効果は素晴らしいです。すばらしい。

生成から伝送、端末への消費まで、継続的な進化を通じて統合技術として発展しています。私たちのチームは、将来ビデオの生成方法に革命的な変化が起こり、今後 20 年間はすべての実務者にとってチャンスをつかむことになると予測しています。これまでは動画を撮影し、3D モデリングやレンダリングによって生成されていましたが、今後は AI をさらに活用してコンテンツを生成する必要があります。また、伝送・配信方法も大きく変化し、さまざまな時間や空間の制約を超えて、映像を一方的に視聴するだけでなく、コンテンツ表示デバイスの没入型化により、人はデジタルで空間に参入するようになるでしょう。人間とビデオにより多くのインタラクションを生成します。

以上が、ライブブロードキャスト・マルチメディア業界全体を把握するための第一のポイントであり、業界が困難に直面しているからといって現在に留まらず、未来にチャンスを求めてください。

2. 継続的な技術進歩の原動力は消費者の体験であり、消費者の体験の追求は無限にありますが、一般的に今私たちがよくするのは、皇帝も饅頭10個を食べ、金の鍬を使っている姿を想像することです。しかし、将来的には技術革新が起こると、人々のニーズもそれに応じて高度化するでしょう。私たちは家で4Kの大ヒット映画を見ることができてとても幸せですが、私たちの年齢の子供たちはどのような経験を追求するのでしょうか、私たちは子供たちの心の中にある思いをもっと知り、彼らの夢を実現する必要があります。

テクノロジーの統合とエクスペリエンスの継続的なアップグレードは産業発展の原動力であり、HUAWEI CLOUD のすべてのビジネスと戦略的設計の出発点でもあります。

65bf923d3fc09420c1412515a3c63f58.jpeg

次に、範囲を絞ります。2023 年の視点から見ると、ライブ配信は時間と空間の限界を常に突破しており、その適用範囲とシナリオは拡大しています。主な開発トレンドは 2 つあります。

1. 中国、特に大陸における生放送は、非常に成熟したシステムから、グローバル化されたインフラストラクチャと機能へと徐々に変化してきました。

中国ではこのシステムが非常に成功しているため、海外の多くの場所で次元削減攻撃となっています。あるユーザーが HUAWEI CLOUD の低遅延ライブブロードキャストに非常に興味を持ち、ビジネス経験に適していると考え、ビジネスをテストしましたが、結果は満足のいくものではありませんでした。理由を調べたところ、アンカーはウクライナ、視聴者はシンガポールやその他の東南アジア諸国で、顧客の要求は 500ms の遅延であることがわかりました。この問題を国内の惰性的な考え方で見ると、私たちのいわゆる「低遅延ライブブロードキャスト」は偽物であり、ウクライナからシンガポールにストリームを送信するのに10秒以上かかります。これが私たちにインスピレーションを与え、時間と空間の制限を打ち破り、世界中でライブブロードキャストサービスを実現するために多くの最適化を行うことにしました。もちろん、最終的には遅延時間は500msに抑えられました。これが、サービスの時間と空間の範囲を継続的に拡張することを意味します。

さらに、人材紹介業界にとってライブブロードキャストは最も効果的な転職手段であるほか、国境を越えた商品の配送や、最近人気の弾幕ゲームなど、ライブブロードキャストのシナリオもますます人気が高まっています。これらはすべて、生放送のゲームプレイを豊かにします。ライブ ブロードキャストはエンターテインメント業界のインフラであるだけでなく、常に都市を征服し、他の業界の生産性向上にも貢献しています。

8ba94b7646b9d8363569f59b85489871.jpeg

2.「現実」を超えて、撮影コンテンツから生成生放送へ。

左側は主に PGC/UGC によって撮影された従来のビデオで、内容は同じ視点からのもので、配信は 1/N です。つまり、私たちが議論しているテクノロジーは CDN のコスト削減であり、せいぜいストレージを少ししか消費しません。

現在、多くの生成コンテンツがあり、主に 2 つの技術システムに分かれています。

1. ジェネレーティブ リアルタイム レンダリング。コンピュータ グラフィックス レンダリング エンジンによって生成されます。三角形を使用して、シーン内のすべてのオブジェクトと人物をモデル化します。それをどのように表現し、人間の目に受け入れられる高品質なコンテンツに変えるかには、多くの GPU コンピューティングパワーが含まれており、視聴者とコンテンツのインタラクションは 1:1 です。

2. AIGC はコンテンツ生成を生成します。最も典型的なアプリケーションはデジタル ヒューマン ライブ ブロードキャストであり、多くの AI 推論による計算電力消費が含まれます。また、視聴者の観点からは 1:1 です。

AI はリアルタイム レンダリングに取って代わるのでしょうか? 私はそうは思いません。CG と CV は深く統合され、相互に補完し、促進し合うと思います。

その理由は次のとおりです。 まず、AI 推論がビデオ生成の角度で 60fps/s を達成すれば、それは生放送です。ただし、3D シーンなどの複雑なシーンで 1080p/60fps を達成することは現時点では不可能です。次に、グラフィック ベースのレンダリングは、一部のシナリオでは代替不可能です。たとえば、産業シナリオでは 1 cm の精度を持つ人またはモデルが必要ですが、これらはグラフィック レンダリングで処理する必要があり、AI 手法では処理できません。

したがって、CG 技術と CV 技術は今後長期間にわたって深く統合され、それらが同時にうまく機能して初めて、優れた生成コン​​テンツを作成できるようになります。

もう 1 つの大きな変更の課題は、コンテンツを 1 対 1 で配信する必要があるかどうかです。どのような帯域幅のコンピューティング能力が必要ですか? それを大規模に普及させるにはどうすればよいでしょうか?これには、ストレージや計算などにいくつかのテクノロジーを使用する必要があるため、将来の配布は完全にポイントツーポイントの RTC とキャッシュで高速化された CDN の状態になります。上記は将来を見据えたものではなく、先物ではなくスポット商品であり、これがファーウェイクラウドの継続的な実践です。

2fbf7bd57da55e73b32c10daa60eeb2c.jpeg

Live + X は進化の過程で多くの課題に直面し、時間と空間の範囲は拡大し続けていますが、どうすれば世界中のユーザーに適切にサービスを提供できるでしょうか? レイテンシのセキュリティとコンプライアンスに準拠したエクスペリエンスに対する要件を満たすにはどうすればよいでしょうか? 本当に先を行き、業界をアップグレードし続け、生成型ライブ ブロードキャスト ビジネスが迅速かつ大規模に価値をもたらすにはどうすればよいでしょうか? コンピューティングの消費電力、ピアツーピアの帯域幅の占有、待ち時間の急激な増加という課題のバランスを取るにはどうすればよいでしょうか? 複雑な技術的閾値を下げるにはどうすればよいでしょうか?

02

時間と空間の制約を突破する

次に、HUAWEI CLOUDに関連する実践を紹介します。

c81fe815061003c90ead00b23f5294ea.jpeg

「時間と空間」の制約を打ち破る大きなチャンスがそこにはあります。

実は私は「海外ビジネス」という言葉にはあまり賛成できません、中国人が海外に行くかどうかに関係なく、海外ビジネスは存在します。私はローカルビジネスにもっと注目していますが、生放送の収益空間は非常に大きく、これは狭義の生放送サービスの空間を指します。ビジネスの成熟度という観点から見ると、東南アジアでは既に慣れ親しんだシステムが比較的完成しているため、アジア太平洋地域が一歩進んでおり、次に北米、欧州が続く。非常に速く、Kuaishou は南米での打ち上げに成功しました。

「変化は海外では目新しいものではありません。YYは2012年に上場し、中国では先駆者でした。2013年に私が東南アジアでファーウェイで働いていたとき、同僚がインドネシアでライブショーを開催しました。当時は理解できませんでした。」なぜなら、当時、ライブブロードキャストは東南アジアでのみエンターテインメントビジネスを行っていましたが、現在ではライブブロードキャストはこれらの地域で生産性ツールとなっているからです。アジア太平洋地域では、誰もがライブ越境電子商取引、ライブ講義、世界的なコンテストを受け入れており、北米、アジア太平洋、ヨーロッパのいずれであっても、Huya Douyu と競合するローカル ゲーム ライブ ブロードキャスト プラットフォームがあります。仮想コンサートや仮想コミュニティなどのシナリオ。

9c7f88271d510617aa213da1717736f7.jpeg

東南アジアを例に挙げると、ライブ ストリーミング電子商取引の規模は今年190 億米ドルに達しており、制作ツールとしてのライブ ストリーミングで業界に力を与える閉ループの商業インフラは、支払いや基本ネットワークを含めて完全に成熟しています。 。中国とインドネシアの全メーカーのライブブロードキャストの総帯域幅を比較し、それを人口で割った結果、現在のインドネシアのライブブロードキャストの規模は、2018年の中国のレベルに相当し、2018年の国内ライブブロードキャストの規模に相当することがわかりました。ユーザーが必要とする限り、CDN サプライヤーは拡大していきます。ネットワークインフラが整備された後、ファーウェイはこれらの国向けに5G基地局と光ファイバーを構築し、十分な商用閉ループを実現し、ライブブロードキャストはテレビの視聴や視聴のためだけでなく、コンテンツを表示するだけでなく、生産性ツールとしても機能するため、開発の余地があります。

中国資本が海外に進出するだけでなく、ファーウェイ・クラウドは現地の顧客をいかに見つけて、現実的な方法でサービスを提供するかにもより注意を払っている。

7366f2c51eebb281943835420d797510.jpeg

中東は、需要と供給の不均衡によって引き起こされる可能性がある、オンライン有名人のライブブロードキャストに対する強い選好を特徴とする急成長している市場です。中国の MCN 運営方法は中東でブームになっており、これは大きなチャンスでもあります。中東は以前、5Gに関していくつかの問題を抱えていたが、過去2年間でインフラが急速に改善しつつある。

8bcec9dbde943e40f5ee80df03a6037b.jpeg

非常に多くの機会と大きな技術空間がある中で、私たちの実践は、顧客がグローバリゼーションの文脈で高品質でビジネスを行うのをどのように支援するかということです。それは中東の顧客にサービスを提供するために中東に行くことではなく、世界にどのようにサービスを提供するかということです。 . 顧客は世界中の自社のビジネスにサービスを提供しています。通常、ユーザーは中国にいて、ストリーミングも中国にあり、ストリーミングも中国にあると誰もが慣性的に考えていますが、実際のビジネスではそうではないことがわかりました。実際のビジネスでは、ストリームをプッシュし、ソース局にプッシュし、CDN にプッシュし、最後に視聴する視聴者が同じ国にいないため、これは大きな課題です。

上記の課題を克服するには、次のことを行う必要があります。

1.ローカル カバレッジの問題を解決する: クラウド ベンダーにとって、大量のリソースを持つことは当然の利点です。過去 2 年間で、HUAWEI CLOUD は世界中の多くの場所でリージョンを新たに開始しました。私はインドネシアをはじめ、トルコ、サウジアラビア、南アフリカなどの拠点を訪問しましたが、現在、世界には 29 のリージョンがあり、すべて高水準の 3AZ です。大規模な CloudOcean/CloudSea ソリューションがリージョンを支援します。巨大なコンピューティング能力とその周辺エリアを提供します。接続されたリソースを合計すると、最大 83 の AZ と 2800 以上の CDN ノードになります。

2ee57b1b3456ebba55239623a3791c40.jpeg

2.地域間の相互接続の問題を解決する: 十分なインフラストラクチャを備えた後、顧客により良いサービスを提供し、上記の課題とシナリオを解決するにはどうすればよいでしょうか? たとえば、ウクライナのアンカーのニーズは、私たちに何かをするよう促しました。元の ADN ネットワークは CDN 内のオーバーレイのオーバーレイ ネットワークであり、この問題を解決するには、このネットワークを海外に展開する必要がありました。少し抽象的ですが、本来の CDN ネットワークはツリー構造になっており、その上にレイヤ 3、4 の高速化ネットワークをオーバーレイすることで、低コストで高品質な Overlay 3 レイヤ ネットワークを提供できます。

元の CDN は 1:N 問題を解決するためにすべて南北のトラフィックでした。今では私たちのリソースで全員の東西の問題も解決できます。クラウド ゲームやクラウド電話など、ビジネスの途中にリンクがない場合でも、消費量が比較的多く、帯域幅の平均価格が 10 元を超える場合は、このプランを使用できます。さらに重要なのは、グローバリゼーションの文脈で南北トラフィックの品質を最適化することであり、右側は、グローバルの文脈で多数のノードを実現し、さまざまな要素を統合してルートを最適化する方法の具体例です。

過去の慣性によれば、国内のネットワークは 1 つだけと考えられますが、グローバル ビジネスを行う場合は、数十、場合によっては数百のネットワークが接続され、各ネットワークには異なる事業者のノードがあり、ノードの品質も異なります。各顧客が異なるか、各ユーザーが複数のビジネスを持っています。元のルーティング選択と品質チューニング パラメーターの選択は、中国の 1 つのネットワークのシナリオ向けであり、1 つの顧客と 1 つのビジネスに必要なパラメーターのセットは 1 つだけです。グローバルなコンテキストにより、すべての国のすべての通信事業者のすべてのノードのパラメータとすべての顧客のビジネスを分離し、ビッグデータに基づいて各パラメータを自動的に調整するよう求められます。これにより、異なるテナントがネットワークに対して異なるルーティング戦略を選択できるようになります。テナントのビジネス特性の SLA 要件。

c79dc72a70d64641c62ba68b6820b09e.jpeg

3.低遅延配信の問題を解決する: 誰もが低遅延テクノロジーに精通しており、低遅延ライブ ブロードキャストの本質は、Google の初期のテクノロジーが中国でより早く、より早く製品化されたことにあります。もこの曲を選びました。国産製品は海外でも人気ですが、用途が限られていることが問題であり、CA/DRM対応という当然の欠点からくるエコロジーによる利用シーンの制限が最大の課題となっています。したがって、私たちは業界全体が団結して協力し、DRM の観点からこの国内の高速ライブブロードキャストと低遅延システムの解決策を見つけ、中国の標準セット全体を活用できるようにすることを求めます。

実は、海外のユーザーと接続するのは非常に苦痛なのですが、MSS というプロトコルをまだ覚えているでしょうか? Microsoft のスムーズ ストリーミングという非常に古いプロトコルです。海外では、環境保護上の理由により、一部のサムスン製スマート TV では MSS を実行する必要がありますが、幸いなことに Huawei 社はそれを実行しており、過去のコードベースから移植することができます。低遅延ライブ ブロードキャストの生態を研究することは非常に価値があります。これは将来のライブ ブロードキャストの方法です。将来のライブ ブロードキャスト、コンテンツ、インタラクション、表示はすべて低遅延を必要とします。Microsoft、Google、およびリンゴ、そしてこの生態系でグループを形成する?という音。

b9180b691610be1c1cb070c626690a6c.jpeg

4.グローバルな運用保守効率の問題を解決する: 顧客ネットワークを構築した後、グローバルな運用保守で最も重要なのは可視化であり、前述のスケジューリングや複数の顧客のマッチングには、主にトラフィックレベルとアプリケーションレベルの可視化が必要です。視覚化、品質の視覚化、帯域幅の視覚化。

これには、ADN のオーバーレイ ネットワーク上での大量のデータ収集が含まれます。

6d01508658e9b15615316d5c08e3d05f.jpeg

これは低遅延のライブ ブロードキャストのケースです。これはトルコのユーザーとインドのユーザーの共同視聴です。彼らはライブ ブロードキャストを見ながら小さなゲームをプレイします。この小さなゲームでは、視聴者は視聴後短時間内に応答する必要があります。ライブブロードキャストのため、コレクションに委ねられている 再生にかかる時間はわずか 500 ミリ秒であり、顧客の HLS、DASH、および CMAF ソリューションは解決されていない 最終的に、ファーウェイの低遅延ライブブロードキャストまたは高速ライブブロードキャストのみが、その要求を満たすことができますビジネスニーズ。

03

「現実」を超えて

c5dcc7208bb3917f21a6d94139162e2a.jpeg

少し前に、私たちは杭州の生放送基地で行われた非公開のライブ会議に参加しました。今後 20 年のトレンドは AIGC です。多くのユーザーが全員 AIGC に参加すると明言していますが、多くの人にとって AIGC は遠い存在です。それはまだ ChatGPT なのか、それとも主に公開による大規模なモデルなのか? 私たちはデジタルヒューマン生放送基地に行きました。規模は大きくありませんが、基地は4月15日にアンカーを全員解雇し、すべてデジタルヒューマン生放送に置き換えました。私たちはデジタルヒューマンライブブロードキャストの使用方法を学びに行きました。これはファーウェイにとって何を意味しますか、そして私たちのチャンスはどこにありますか?

交換後、AIGC には大きなチャンスがあると考えています。これには多くの応用シナリオが含まれます。いくつかの例を挙げると、国内外の多くのテレビ局がうまくいっていません。たとえば、フェニックス衛星テレビには小規模な技術チームがあり、コンテンツにデジタル ヒューマン テクノロジーを使用することに非常に興味を持っています。放送。もう 1 つの例は、商品を持ったデジタル人々のライブ ブロードキャストや、一部のショッピング モールでのデジタル不死関連の店舗の出現であり、これにより、高齢者や子供をデジタル化し、感情的な交流を図ることができます。これらのシナリオはまだ非常に初歩的ですが、総合すると、これが次のことを示しています。今後の開発動向です。メタバースにはオンライン ゲームやバーチャル アイドルなどのシーンが増えています。これはもはやエンターテイメント業界やストリーミング メディア テクノロジーによってもたらされた変化ではなく、業界全体の生産性の要因となっています。

成功したビジネス ケースを 2 つ紹介します。

1.東南アジアにおける商品の国境を越えた配送:不完全な統計によると、毎日 10,000 以上のビジネス ルートが運行されています。その中にはデジタル担当者による多数の生放送も含まれるが、その最大の原動力は圧倒的な低コストである、例えば東南アジアで一足の靴を販売するのに20か国20言語が必要であることは明らかに非現実的である。放送するアンカーを 20 人見つけると、靴を購入できます。複数のデジタル アンカーがおり、インドネシア語、マレー語、その他の言語であっても、1 日 24 時間ライブ放送を行っています。このセッションでインドネシア語を話すのは私だけかもしれませんが、それは問題ではありません。私のデジタル ツインは 20 か国語を話すことができます。デジタル ヒューマンの出現により、音声の壁が解決され、ライブ アンカーの穴が埋まりました。

2. 社会分野の事例: 写真の女性は、184 万人のファンを持ち、年収 100 万ドルのインターネット有名人であることが判明しました。彼女はバーチャルガールフレンドサービスを開始し、多くの人が登録し、現在の年収はテイラー・スウィフトに匹敵する6000万ドルに達した。国内で同様のビジネスを希望されるパートナー様がいらっしゃいましたら、全力でサポートさせていただきます。

3dbc7b516a614814a954e1b33520d077.jpeg

3. 3D 空間の場合: これは比較的単純で、デジタル人々はメタバース空間でライブ ブロードキャストを視聴します。写真はファーウェイ独自のライブブロードキャストを示しています。

619d36af7f7a3b190e46ddf305df5bc4.jpeg

901745fc92227f6f6be1ad375cdf9e7c.jpeg

上で述べた非常に多くのシナリオと非常に多くのイノベーションにより、一部のパイオニアはすでに成果を上げています。この業界でビジネス イノベーションのパートナーとしてどのように機能するか、中心的な問題はコンピューティングの電力コストと伝送コスト、および電力コストを削減する方法です。テクノロジー使用の限界。

HUAWEI CLOUD のソリューションは、MetaStudio デジタル ヒューマン ライブ ブロードキャスト ブランドを開発することであり、モデル作成、ライブ ブロードキャスト スキル、および 10 チャンネルを備えた 1 枚のカードという 3 つの主要な機能があり、それぞれ参入しきい値、効果的な運用、および迅速なコスト削減に対応します。最後に、デジタルヒューマンはレンダリングによって駆動されます(主に 1 枚のカードと 10 チャンネルに対応)。

bec638cf1f497e7540fb65005dade495.jpeg

モデル作成には 3 つの方法があります。

1. 言葉はデジタルヒューマンを生成します:Wen Shengtu、グラフは人間を生成します、そして本質はWen Shengデジタルヒューマンです。画像の説明を入力すると10秒程度でデジタルヒューマンが生成され、後から駆動することが可能です。

2. 写真からデジタル ヒューマンを生成: 写真から 1 分でデジタル ヒューマンを生成できます。

3. ビデオからのデジタル ヒューマン生成: デジタル ヒューマンのライブ ブロードキャスト シナリオでよく使用され、デジタル ヒューマン画像を生成するには 5 分間のコーパスが必要で、トレーニング範囲は 3 ~ 6 です。

デジタルヒューマンには画像だけでなく音声も必要であり、そのために3つの音色サービスを提供しています。

1. プリセットサウンド: 無料のロボット風のサウンド、

2. トーン クローン: エフェクトは典型的なニュース放送トーンで、3 ~ 5 分の音声を提供します。ユーザーはビデオを録画しながら直接話すことができ、一緒に送信するだけです。音色は私のものですが、感情はなく、ナレーションはストレートで、内容はニュース放送の形式で放送され、修復度は80%に達し、一部のシーンでは満足できます。

3. 高忠実度の音色クローニング:物を運ぶなどの場面では、より人の声に近い音色が求められるため、高忠実度の音色クローニングが必要となります。トレーニングには2~5時間のスタジオレベルの音声素材が必要で、ユーザーの話し方の癖や、発音マントラ、間、自分では感知できない感情の変化までトレーニングすることが可能で、回復率は95%、そしてコストも高くなります。

4a12b8f106d39c65885e10e7a1b3e29b.png

9e5fd280f22033c80fa785c2a0820aa5.png

この図は、ダブル デジタル ヒューマン モデルのデモンストレーションです。モデルのトレーニング時間は3~6時間で、ユーザーは背景を選択し、弾幕ギフト報酬のフィードバックを含む言葉を入力するだけでデジタルヒューマンの生放送を開始できる。

ここで明確にする必要があるのは、このプラットフォームが提供されているにもかかわらず、ファーウェイには多数のビジネスを反復する能力がないということです。なぜなら、私たちのポジショニングは、多くの人を生み出して運営することではなく、パートナーがコストを生み出すのを支援することだからです。有能で質の高い人材を集め、サービスを提供します。すべての機能のバックグラウンドには API があり、パートナーと顧客は API を通じて機能を使用することが期待されています。パートナーはこのプラットフォームを使って試してみることを歓迎しますが、デジタルライブブロードキャストやその他のアプリケーションシナリオでカルテットを殺す可能性のあるSAASプラットフォームになることがファーウェイの立場ではないことを強調したいと思います。

d0ef934a486e9bac2900a628bbd7203c.jpeg

また、デジタルヒューマンの生放送スキルの大規模モデルも提供しており、多くのモデルがありますが、客観的に見て、大規模なモデルは信頼できません。結局のところ、ライブ ブロードキャストをデジタル担当者だけに依存し、ChatGPT を使用してライブ ブロードキャストを普及させるのは非現実的です。その結果、この流れに沿ってデジタルヒューマン生放送オペレーターという新たな職業が誕生し、その多くが聾唖者であることにより、聾唖者の雇用問題は急速に解決されました。聾唖者は、身体的な制限があるにもかかわらず、話すことに非常に強い意欲を持っていますが、彼らの利点は、物事を行うことにより集中していることです。彼らはデジタル ヒューマン ライブ ブロードキャスト オペレーターになり、Pangu モデルまたは ChatGPT の恩恵を受けて、継続的に話すことができます。ライブ ブロードキャストのスキルやライブ ブロードキャストの操作を最適化および反復し、他のユーザーとコミュニケーションをとる喜びを見つけます。

56a1cff1c784fef6ae224bbf8f50bd53.jpeg

これはライブスピーチスキルの大規模なデモンストレーションであり、製品タイプ、元の価格、現在の価格、No.1 リンクなどの商品スピーチスキルのプロンプトを入力し、最終的に複数の結果を生成します。

0c9397b54e087fbcf2a33f52c761f2d4.jpeg

HUAWEI CLOUD は、生成コンテンツに関してフルストップのサービスを提供し、独自に開発したローカライズされたコンピューティング能力を備えていますHuawei Ascendチップは、コンピューティングパワーの観点から生成ライブブロードキャストと将来のシーン推論のためのソリューションを備えており、これらのシナリオを徹底的に最適化し続け、デジタルに必要な1枚のカードと10チャンネルなど、Nvidiaシリーズでは実現できない機能を提供します。人間の世代、待ってください。

HUAWEI CLOUDの利点は、向上するコンピューティング能力、コンピューティング能力の上のモデルレイヤー、デジタルヒューマンアルゴリズム、レンダリング全体、ストリーミング、およびライブブロードキャストプラットフォーム用の完全なソリューションセットを通じて、ユーザーが生成型ライブブロードキャストを迅速に実現できるように支援することです。 。

この共有によって、HUAWEI CLOUD の業界とその機会に関する知識と理解がすべての人に伝わることを願っています。以上が今回のシェアです、皆さんありがとうございました!


7b7fa5dbf427e9f0f3049a8f57bc8293.jpeg

LiveVideoStackCon はすべてのマルチメディア技術者にとっての舞台です。チームや会社の責任者、特定の分野や技術で長年の実務経験があり、技術交流に熱心な方は、ぜひ LiveVideoStackCon のプロデューサー/講師にご応募ください。

下記のQRコードを読み込むと講師募集条件や講師特典などをご覧いただけます。ページ上のフォームを送信して、講師の申し込みを完了してください。カンファレンス組織委員会はあなたの情報をできるだけ早く検討し、資格のある候補者と連絡を取ります。

3f12aebc1c217fb3f2b76fdedc3b2b91.jpeg

上の QR コードをスキャンしてください 

講師応募フォームに必要事項を記入してください

おすすめ

転載: blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/132073916