yolov7~ 陽性サンプル分布と陰性サンプル分布

この記事は非常に短いので、自分の勉強のためにここに移動しました。

全体として、陽性サンプルと陰性サンプルの分布において、yolov7 の戦略は yolov5 と YOLOX を組み合わせたものです。したがって、この記事では、yolov5 と YOLOX のポジティブおよびネガティブ サンプル割り当て戦略の分析から始めて、それを YOLOv7 の分析に導入します。

全体として、陽性サンプルと陰性サンプルの分布における yolov7 の戦略は、yolov5 と YOLOX の組み合わせです。

まず、yolov5 と YOLOX の陽性サンプル分布と陰性サンプル分布を簡単に確認します。

著者の能力が限られているため、記事に間違いがある可能性がありますが、ご指摘いただければ幸いです。

yolov5 の陽性サンプルと陰性サンプルの配布戦略

ターゲット検出の陽性サンプルと陰性サンプルの配布戦略:

ステップ:

ステップ①: アンカーと gt を照合して、どの gt が現在の特徴マップの正のサンプルであるかを確認します。

ステップ②: 現在の特徴マップのポジティブ サンプルを対応するグリッドに割り当てます。

図 1: 実線のグリッドは特徴マップを表します。点線は、特徴点グリッドを 4 つの象限に分割することを表します。青い点は gt の中心点の位置を表します。

そして、その特徴は次のとおりです。

アンカーベース

② gt は複数のアンカーに一致する場合があります。

③ アンカーが gt と一致する場合、現在のアンカーには 3 つの陽性サンプルが存在します。(理論的には、アンカーが 9 個ある場合、gt は最大 9*3=27 個の陽性サンプルを生成します)

YOLOX ポジティブおよびネガティブサンプル割り当て戦略

そして、その特徴は次のとおりです。

アンカーフリー

②simOTAは各gtがどれだけの陽性サンプルを持っているかを自動的に分析できます。

③ 各 gt をどの特徴マップから検出するかを自動的に決定できます。

yolov7 の陽性サンプルと陰性サンプルの配布戦略

まず第一に、yolov7 は依然としてアンカー ベースのターゲット検出アルゴリズムです。yolov7 は、yolov5 と YOLOX のポジティブとネガティブのサンプル割り当て戦略を組み合わせています。プロセスは次のとおりです。

yolov5: yolov5 の正および負のサンプル割り当て戦略を使用して、正のサンプルを割り当てます

②YOLOX  各GTの各サンプルのReg+Cla loss(Lossを意識した)を計算

YOLOX: 各 GT の予測サンプルを使用して、割り当てる必要がある陽性サンプルの数を決定します (Dynamic k)

YOLOX: 各 GT について、損失が最小の最初の動的 k サンプルを正のサンプルとして取得します。

⑤YOLOX  複数のGT陽性検体に同一検体が割り当てられている場合を手動で削除(グローバル情報)

実際には、主にsimOTA の最初のステップである「事前センターの使用」を「yolov5 の戦略」に置き換えることです

このコードでは、yolov5 と YOLOX の多くのソース コードも再利用しています。

個人的には、YOLOX での yolov5 戦略と simOTA 戦略の統合は、yolov5 戦略のみを使用する場合と比較して、損失認識が追加され、現在のモデルのパフォーマンスを使用して別の細かいスクリーニングが実行されますYOLOX で simOTA のみを使用する場合と比較して、融合戦略はより正確な事前知識を提供できます

yolov6 などの研究者も simOTA を配布戦略として採用しており、simOTA は確かに大きな改善をもたらす戦略であることがわかります。

yolov7中AUX HEAD

図 3: yolov7 の論文における aux ヘッドの紹介

aux ヘッドはyolov7 のp6 モデルで使用されます。

この論文では、補助ヘッドとリード ヘッドがモデルの最適化に併用されること、および補助ヘッドのラベルが比較的「ラフ」であると述べています。

ソース コードを見ると、 aux ヘッドの割り当て子とリード ヘッドの割り当て子の間には、次のようなわずかな違いしかないことがわかります。

①先頭ヘッドの各アンカーと gt が一致する場合、3 つの正のサンプルが割り当てられ、補助ヘッドでは 5 つの正のサンプルが割り当てられます。

②上位 10 個のサンプルはリード ヘッドで合計されて四捨五入され、トップ 20 は補助ヘッドで取得されます。

これもこの論文の見解を裏付けるものです。AUX ヘッドはそれほど強力ではなく、AUX ヘッドはリコールに重点を置き、リード ヘッドは AUX ヘッドからサンプルを正確に選択します。

図 4: yolov7 の論文における aux ヘッドの紹介

yolov7 の陽性サンプルと陰性サンプルの分布方法に従って、図 5 の場合、青い点は gt の位置を表し、実線で構成されるグリッドは特徴マップ グリッドを表し、点線は 4 つの象限に分割されたグリッドを表します。正のサンプルと負のサンプルを割り当てるには (理解できない場合は、yolov5 の assign メソッドを参照する必要があります)。

gt が青い点の位置にある場合、リード ヘッドの黄色のグリッドが陽性サンプルになりますAUX ヘッドでは、黄色+オレンジ色のグリッドがポジティブ サンプルになります

図 5: トレーニング中のリードヘッドと補助ヘッドの陽性サンプルの分布図 (青い点は gt の位置を表し、実線で構成されるグリッドは特徴マップ グリッドを表し、点線は 4 つに分割されたグリッドを表します)象限 ポジティブとネガティブのサンプル分布用。gt が青い点の位置にある場合、リード ヘッドでは黄色のグリッドがポジティブ サンプルになります。補助ヘッドでは黄色 + オレンジのグリッドがポジティブ サンプルになります)

推論中、以下の図 6 では、青い点は gt の位置を表し、実線で構成されるグリッドは特徴マップ グリッドを表し、点線は 4 つの象限に分割されたグリッドを表し、yolov5 の中心に従って点が表示されます。回帰法では、画像内の赤い特徴グリッドと、画像内の赤 + 青の領域を予測することしかできませんが、中心点を予測することは不可能です。そして、赤色の特徴グリッドはトレーニング中にポジティブ サンプルとして使用されます

補助ヘッドでは、モデルはこの状況に対して回帰方法を変更しませんでした。したがって、実際には、Aux ヘッドでは、ポジティブ サンプルとして割り当てられた領域であっても、継続的に学習した後でも、特に良好なエフェクトに完全に適合できない可能性があります。

図6:推論時、赤いグリッドで推論できるcxとcyの範囲(青点はgtの位置、実線で構成されたグリッドは特徴マップグリッド、点線は分割されたグリッドを表す) 4象限に分割)

損失の融合に関しては、補助損失水頭と鉛損失水頭が 0.25:1 の比率で融合されます。

wwwosoft あなたはhttp://143ai.comにアクセスします  

おすすめ

転載: blog.csdn.net/qq_29788741/article/details/131263286