次世代ライブブロードキャストシーンではビデオアクセラレーションカードが大活躍

編集者注:ライブストリーミング市場の規模はどれくらいですか?2021 年のデータによると、世界のビデオ市場の 70% 以上がライブ コンテンツによって占められています。従来のライブ ブロードキャスト シーンと比較して、新世代のライブ ブロードキャスト シーンは主に多対多のモデル、つまり全員がアンカーです。このようなリアルタイムでインタラクティブなアプリケーションのシナリオでは、低遅延、大容量、帯域幅の削減...新たな変更によってもたらされるコスト圧力にどのように適応すればよいでしょうか? 新しいアーキテクチャはいつ登場しますか? このような疑問を抱いた LiveVideoStackCon2023 上海オーディオおよびビデオ技術カンファレンスでは、AMD AECG システム ソリューション アーキテクトの Xie Min 氏を招き、AMD ビデオ アクセラレータ カードの基本アーキテクチャと機能、およびさまざまな分野のビデオ ソリューションにおけるアプリケーションについて詳しく説明しました。

acfc3e9ce2c92da25b23eea8c72e96df.jpeg

インタラクティブ ストリーミング市場は急速に成長しています。

インタラクティブなライブ ブロードキャスト、クラウド ゲーム、オンライン ショッピング... ライブ ビデオ ブロードキャストがビデオ市場の主流になるにつれて、ユーザーはデータ ソースと受信者の両方となり、伝送チャネル密度とリアルタイム帯域幅、およびエッジ データの増加につながります。センターは大きなプレッシャーにさらされています。これにより、新世代のストリーミング メディア ソリューションの出現が差し迫っています。

Alveo U30 に続き、AMD は今年 4 月に新しいビデオ アクセラレータ カード Alveo™ MA350D (以下、MA350D) を正式に発売しました。

0d552970244dcf08e68aad9fc5294e00.pngこのうち、35 は Alveo U30 以降の新世代の製品を表し、D は 32 の 1080p ビデオ ストリームを同時に処理できる 2 つの (デュアル) ビデオ処理ユニットを表します。

言い換えれば、MA350D は大容量のインタラクティブ ストリーミング メディア向けに調整されています。

Xie Min 氏は、高密度、低遅延、低消費電力、シンプルな統合というMA350D の 4 つの利点を要約しましたストリームあたり 1W の電力で、カードあたり最大 32 チャネルの 1080p60 トランスコーディング密度を提供できます。4K エンコード遅延は 8 ミリ秒と低く、これは従来の処理時間 (16 ミリ秒) のわずか半分です。直接コマンド ライン呼び出しをサポートします。 FFmpeg と Gstream の互換性があり、ユーザー開発に便利な XMA ベースのユーザー API もサポートしています。

前世代製品 Alveo U30 と比較して、MA350D のチャネル密度は 4 倍に増加し、消費電力は 3 倍に削減され、遅延は 4 倍に減少しました。

AI がビデオ コンテンツを分析すると、半分の労力で 2 倍の結果が得られますか?

MA350Dの設計プロセス中に、AMDがビデオのコンテンツを分析するために人工知能を導入したことは言及する価値があります。これは確かに良い道であり、人工知能と機械学習の機能を通じて、動画の複雑さや種類などの特徴をより深く理解し、品質を確保しながら作業効率を向上させることができます。

baebab41c26d331640b218ec99e8f44b.jpeg

「人工知能と機械学習によって得られる洞察とインテリジェンスを使用すると、この動的なコンテンツをより効率的にエンコーダーに送信できます。これにより、動的なビデオ処理を行う際の帯域幅とストレージを削減できます。同じ時間に。」

このような実際のシーンを見てみましょう。夕方の一般的なニュースでは、司会者が大きな写真の形で全員に放送します。しかし、その過程で突然、車やスポーツイベントに切り替わり、最後には司会者に切り替わるなど、ダイナミックな映像が登場します。ホストが画面をホストする場合、人工知能は帯域幅を減らすようにエンコーダーを構成できますが、スポーツ イベントに切り替える場合は、リアルタイムで動的調整を行うことができます。

4d0b0df2c88482dbedaf4586a99de33e.png

同じビットレートで圧縮された 2 つの画像の場合、AI テクノロジーを使用しない画像の方が欠陥が多く、解像度が低くなります。したがって、AI テクノロジーは顔を見つけて、顔の主要な領域により多くのビットを割り当て、他の領域のビット構成を減らすのに役立ちます。この写真では、顔の部分をキーエリアと呼びます。AI を使用すると、どの領域が重要な領域であるかを認識し、処理時にさまざまなリソースを構成できます。これにより、顧客またはストリーミング メディア サービス プロバイダーは、品質を維持しながらより積極的な圧縮を実行し、ビット レートを下げることができます

ただし、人工知能は完璧ではないため、動的な調整を行う際には判断ミスが生じる可能性があります。したがって、AMD が採用したアプローチの 1 つは、VQ 分析 IP ブロックです。人工知能の動的な調整と変更のプロセスにおいて、IP モジュールはフィードバック ループを形成し、行われた決定が間違っていないことを確認します。VQ 分析によりビデオの各フレームの品質を保証でき、エラーが発生した場合は時間内に調整できます。

 AV1 は多大な貢献をしました 

LiveVideoStack は、主流の H.264 と H.265 のサポートに加えて、MA350D が AV1 のサポートも追加し、AV1 用に 2 つの別個のコーディング ユニットを備えていることに気付きました。

0969a5c9dc646fa170a5947509220a66.png

Xie Min 氏は LiveVideoStack に対し、AV1 は比較的新しい規格であり、より高い圧縮率を備えた著作権フリーのコーディング規格/フォーマットであり、その利点は、ユーザーがより低い帯域幅のコード ストリームでより高品質を送信できることであると述べましたチップの四隅に AV1 圧縮規格をサポートする 4 つの個別のエンコーダ (MP) ユニット モジュールがあるため、新しい圧縮規格を導入する際、古い規格を使用しながら同時に新しい規格を追加できます

「もちろん、その代償として、エンコードとデコードではより複雑な計算が使用され、より多くの CPU リソースが必要になり、大きな遅延が発生します。現時点では、AV1 ハードウェア エンコード ユニットの利点が強調されており、CPU 使用率が削減され、超低パフォーマンスが提供されます。待ち時間。」

8014678fec167da0b050714758cca2d2.pngAMD のテスト結果によると、同じ視覚品質内で、AV1 エンコーダの帯域幅節約率は 52% にも上ります。

アライアンス・フォー・オープン・メディアの会長マット・フロスト氏は次のように述べた。

「ライブプロバイダーは、高密度、低消費電力、低遅延の AV1 ソリューションを求めており、これらのニーズに対応することで、AMD のようなアライアンスメンバーは AV1 の展開と全体的な採用の推進を支援しています。」

586 より前のマルチメディア カードから、今日の AI ビデオ分析コンテンツと統合されたマルチメディア アクセラレータ カードに至るまで、オーディオおよびビデオのハードウェア テクノロジは長く曲がりくねった発展を経験してきました。しかし、歴史の歯車は止まることはなく、常により高く、より速く、より強い方向に転がり続けます。

Alveo MA35D 製品とアーキテクチャの詳細を学び、それがもたらす優れたコーデック パフォーマンスのデモをご覧ください。下のポスターをクリックして、AMD のテクノロジー共有とライブ デモンストレーションに参加してください。


be34d8fa68daa8395357c1d0915da7f0.png

画像内のQRコードをスキャンするか、「元のテキストを読む」をクリックしてください 

LiveVideoStackCon 2023 Shanghai Station のさらにエキサイティングなトピックをチェックしてください

おすすめ

転載: blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/131798908