深層学習の論文: ISTDU-Net: 赤外線小型ターゲット検出 U-Net とその PyTorch 実装
ISTDU-Net: 赤外線小型ターゲット検出 U-Net
PDF: https://doi.org/10.1109/LGRS.2022.3141584
PyTorch コード: https://github.com/shanglianlm0525/CvPytorch
PyTorch コード: https://github.com/shanglianlm0525/PyTorch-Networks
1 ISTDU ネット構造
ISTDU-Net ネットワークの全体構造を図 1 に示します。これは、エンコーダ、デコーダ、マージ接続の 3 つの主要な部分で構成されます。
エンコーダ部分は、入力画像をダウンサンプリングし、解像度を下げ、チャネル レベルでの特徴の深さを広げる役割を果たします。これは、特徴マップ群に重みを付けることで入力画像の特徴を抽出し、小物体の表現力を高めることを目的としています。
デコーダ部分は、高解像度の特徴マップと低解像度の特徴マップのマルチスケール特徴融合を実行する責任があります。異なる解像度の特徴マップを融合することで、より豊富な特徴情報を取得できるため、ターゲット検出の精度が向上します。
エンコーダとデコーダはジャンプ接続を介して接続されます。全結合層がスキップ接続に導入され、グローバル受容野に基づいて入力特徴マップ上で特徴の認識と調整を実行します。これにより、小さなターゲットと背景との違いが強調され、ターゲット検出のパフォーマンスが向上します。
ISTDU-Netネットワーク構造の概略図
2 損失関数
赤外線による小さなターゲットの検出は、実際には入力画像の各ピクセルに対するバイナリ分類問題です。モデルのパフォーマンスを測定するには、平均二乗誤差 (MSE) が損失関数として使用されます。