時空間を意識した多重解像度ビデオの強化
1.まとめ
同時に、時間と空間の超分割を行います。高解像度はモーションの詳細を改善でき、高フレームレートはモーションの調整に役立ちます。このホワイトペーパーの方法は、ST-SR中に潜在的な低解像度および高解像度の表現を生成するモデルコンポーネントを使用して、空間SRまたは時間SRのみの専用メカニズムを微調整できることです。
著者は、時空間認識多重解像度ネットワークSTARnetを提案しました。STARnetは、ST-SRのLRからHRへの直接接続を提供することにより、図1(の紫色の矢印で示すように、LRおよびHR空間でのS-SRとT-SRの相互強化の空間的および時間的表現を明確に組み込んでいます。 e)表示します。
2、STA多重解像度
2つの低フレーム画像を提供します(I tl、I t + 1 l)(I_t ^ l、I_(t + 1)^ l)(私はtリットル、私t + 1リットル)、サイズは(Ml×Nl)(M ^ l \ times N ^ l)(Ml××Nl)、スーパースコアの結果は(I tsr、I t + nsr、I t + 1 sr)、n∈[0、1](I_t ^ {sr}、I_ {t + n} ^ {sr}、 I_ {t + 1} ^ {sr})、n \ in [0,1](私はtS R、私t + nS R、私t + 1S R)、n∈[ 0 、1 ]、サイズは(Mh×Nh)(M ^ h \ times N ^ h)(Mh××Nh)、目標は{I tsr} t = 1 T + \ {I_t ^ {sr} \} _ {t = 1} ^ {T +}を生成することです{
私はtS R}t = 1T +。
ネットワークは3つのステップに分かれています。
- 初期化
- 洗練
- 再構築
は、式に従ってネットワーク図を自分で描くことを提案します
2.1初期化(ステージ1)
この部分は主にS-SR、T-SR、ST-SRの共同学習を実現します。入力中の2つの低フレームRGB画像(I tl、I t + 1 l)(I_t ^ l、I_(t + 1)^ l)(私はtリットル、私t + 1リットル)、およびそれらの双方向オプティカルフロー図(Ft→t + 1、F t + 1→t)(F_ {t \ to t + 1}、F_ {t + 1 \ to t})(FT → T + 1、FT + 1 → T)
第1ステージの出力は、中間フレームのHRおよびLR機能です。Ht+ n H_(t + n)HT + NそしてLt + n L_ {t + n}LT + N。
この段階で、STARnetはサイクルの一貫性を維持します1)S-HRとS-LR、2)tとt +1。
2.2リファインメント(ステージ2)
サイクルの一貫性をさらに維持して、機能マップを再度完成させます。
2.3再建(ステージ3)
4つの機能(H ^ t、H ^ t + n、H ^ t + 1、L ^ t + n)(\ hat H_t、\ hat H_(t + n)、\ hat H_ {t + 1}、\帽子L_ {t + n})((H^トン、H^T + N、H^T + 1、L^T + N)変換换成対的画像像(I tsr、I t + nsr、I t + 1 sr、I t + nl)(I_t ^ {sr}、I_ {t + n} ^ {sr}、I_ {t + 1} ^ {sr}、I_ {t + n} ^ l)(私はtS R、私t + nS R、私t + 1S R、私t + nリットル)。
2.4トレーニングの目標
S-HRイメージはgtとして使用され、T-HRフレームはgtとしても使用され、損失は
スペース損失I tsr I_t ^ {sr}として記述できます。私tS R、I t + 1 sr I_ {t + 1} ^ {sr}私t + 1S R
時間損失It + nl I_ {t + n} ^ l私t + nリットル
時空間損失It + nsr I_ {t + n} ^ {sr}私t + nS R
損失関数、
上記の各損失にはL 1L_1が含まれますL1アイテムとLvgg L_vggLvグラムグラムのアイテム。
2.5フローリファインメント
大きなモーションビデオにフレームを挿入することは困難です。大きな動きによって引き起こされるフローノイズは、補間結果に悪影響を及ぼします。著者は、フロー画像をリファインまたはノイズ除去するための簡単なソリューションであるフローリファイン(FR)モジュールを提案します。