[論文の解釈] H.264/AVC ビデオ符号化のための高速サブピクセル動き推定アルゴリズム

序章

タイトル: H.264/AVC ビデオコーディングのための高速サブピクセル動き推定アルゴリズム 原文
: https://ieeexplore.ieee.org/document/5688303レベル
: SCI
: 2011
機関: 上海交通大学
結論: サブピクセル検索 計算の複雑さが大幅に軽減され、サブピクセル検索ポイントが 50% 以上削減され、品質の低下は無視できます。リソースのダウンロード
: https://download.csdn.net/download/yanceyxin/88036738

論文通訳

まとめ

動き推定は、ビデオ コーディングの最も時間のかかるモジュールの 1 つです。従来のビデオ コーディング標準の ME と比較して、H264 で複数のパーティション サイズを使用すると、動き推定に時間がかかります。高速アルゴリズムにより、整数ピクセル検索の複雑さが軽減されます。 、サブピクセル検索の計算オーバーヘッドは非常に大きくなるため、論文では、ブロック選択の前に「粗い」サブピクセルを選択し、その後、最適なブロックを「細かく」サブピクセル検索することで削減できることを提案しています。従来のアルゴリズムのサブピクセル検索ポイントと比較して 50% 削減され、品質の劣化は無視できます。

基本原則

ほとんどのサブピクセル ME 最適化手法は、単峰性曲面の仮定に基づいており、サブピクセル MV (SPMV) を予測し、小さなサブピクセル MV で最終的なサブピクセル MV を検索するという 2 つのステップでサブピクセル検索を実行します。 SPMVの領域; これらの手法は空間情報とSAD曲面モデリングの2種類に要約できます。

SPMV を取得する 2 つの方法:時空間情報(式 1 など、β=4 は 1/4 ピクセル、β=8 は 1/8 ピクセル)、SAD モデリング(式 4 など) 、
ここに画像の説明を挿入
高速サブピクセル ME方法の比較:実践が証明しています。MB の最適なパーティションのみが正確なサブピクセル MV を必要とし、他のパーティションはモード間の選択にのみ使用されます。サブピクセル SAD が最適なパーティションを選択するのに十分であれば、検索する必要はありません。最初の段階でより正確なサブピクセル ポイントを実現します。整数ピクセルの SAD プレーン情報は、サブピクセル SAD をオフにするかどうかを決定するために使用できるため、この記事では、ラフ戦略ベースの高速サブピクセル動き推定アルゴリズム (RFSME) を提案しています。
ここに画像の説明を挿入
RFSME
アルゴリズムの全体的なプロセス:
ここに画像の説明を挿入
SAD および MV のビット数を COST として使用します。
ここに画像の説明を挿入
■ ステップ 1:整数ピクセルの最適な COST 位置と、その 4 つの隣接する整数ピクセル位置の 2 つの平均 COST (水平平均、垂直平均)差が小さい場合は、COST 平面が非常に平坦であることを意味し、この時点での最適な整数ピクセル COST は最適なサブピクセル COST に近いため、この時点での最適な整数ピクセル COST は、最適なサブピクセル COST. このとき、現在のブロックのサブピクセル COST ピクセル ME はスキップできます; この時点でのピクセル全体の最適なブロック位置がステップ 4 で使用されます; 以下のように、ブロックタイプ (i)には 8x8、8x4、4x8、4x4 が含まれ、ブロックタイプ (ii) には 16x16、8x16、8x16 が含まれ、th1、th2、および rF はそれぞれ 10、20、および 5/4 です。
ここに画像の説明を挿入
■ステップ2:step1 で COST 平面が平坦でない場合、2 つのサブピクセル MV 予測方法を使用して 2 つの SPMV が取得され、最小の COST が選択されて COSTstep2 と名付けられ、対応する MV が MVstep2 として定義されます。表 1 は、最良のサブピクセル MV と MVstep2 の間の絶対距離を示しています。これは、MVstep2 が最良のサブピクセルに対して適切な予測を提供できることを示しています。COSTstep2 と最良のフルピクセル COST との絶対差 (COSTbest_full_pixel は D=|COSTstep2 - COSTbest_full_pixel| として定義されます。D が小さい場合、COST があまり削減されていないことを意味し、COSTstep2 は最良のサブピクセルに十分近い)モデルとしてピクセル COST が選択されています。このとき、ステップ 4 の位置選択には COSTstep2 が適用されます。次の式では、rD は 3/2 の値をとり、COSTmin_step2 = min(COSTstep2, COSTbest_full_pixel)となります。 ■ step3: D の場合が大きい場合、
ここに画像の説明を挿入
COSTstep2 は最適なサブピクセル Pixel COST に近くない可能性があります。このとき、隣接する 2 つの垂直点と MVstep2 に隣接する 2 つの垂直点が検出され、最終的な 1/4 ピクセル点が式 8 によって決定および選択されます。 -9. ■ ステップ 4
ここに画像の説明を挿入
:ステップ 1、2、および 3 から選択された COSTrough 最適なブロック位置を選択するために使用されます;
■ ステップ 5: COSTrough の周囲で小さな範囲のサブピクセルのさらなる絞り込み検索が適用され、8 1/4 ピクセルが現時点では最適な分割のみが実行されるため、COSTrough の周囲を検索するために選択されます。そのため、従来の高速サブピクセル検索アルゴリズムと比較して、位置ごとの平均検索ポイントが削減されます。

結果

ここに画像の説明を挿入

おすすめ

転載: blog.csdn.net/yanceyxin/article/details/131667892