軽量ViTとCNNの融合による広範囲赤外画像の超解像再構成

まとめ

畳み込みニューラルネットワークの注意メカニズムモデルは、広範囲の波長の赤外線画像を再構成する際に局所的な特徴にしか焦点を合わせることができず、受容野が小さいため、広範囲の赤外線の再構成に適した融合軽量ビジュアルトランスフォーマー(ViT)が必要となります。畳み込みニューラル ネットワークを使用したモデル。このモデルは、軽量 ViT ブロックと組み合わせた改良された軽量残差ブロックを使用して、グローバルな自己注意メカニズム モデルを構築し、異なる特徴マップ領域間の長距離注意依存関係を学習して再構成を支援し、解空間を制約し、フーバー損失関数を使用します。モデルを安定して収束させ、反復的なアップサンプリングとダウンサンプリングを通じて高解像度画像と低解像度画像のペアの深い変換関係を掘り出します。実験に近赤外画像データセットと遠赤外画像データセットを使用したこのモデルは、ピーク信号対雑音比と1031Kパラメータとの構造類似性比較の点で、1518Kパラメータの軽量モデルSRResNetと1592KのCARNを上回りました。これは、パラメータ量が 4 543K の重量級モデル EDSR に近く、このモデルがさまざまな波長の赤外線画像を効果的に再構成できることを示しています。

0はじめに

画像の超解像度再構成とは、低解像度の画像 ( Low Resolution LR ) を高解像度の画像 ( High Resolu )に再構築することを指します。

おすすめ

転載: blog.csdn.net/weixin_70923796/article/details/131226571