【ターゲット検出におけるIoUの改善】GioU、DIoU、CIoUの詳細紹介

1、IoU

  • IoU は交差と和集合の比率です。つまり、pred と Ground Truth の場合は、交差/和集合です。
    ここに画像の説明を挿入

1. IoU は評価指標として使用でき、IoU 損失 = 1 - IoU の
欠点を構築するためにも使用できます。
2. pred と GT の共通部分については、IoU が 0 ではないため、IoU 損失は逆伝播できます。勾配を計算することができます。ただし、2 つが交差しない場合、勾配は 0 になり、最適化できません。
3. pred と GT が交差しない場合、IoU は 0 となるため、両者の距離が遠いか近いかを判断できません
ここに画像の説明を挿入
4. IOU は 2 つのオブジェクトの重なり方を反映できません (交差法)。どちらの場合も IOU は 0.14 ですが、(a) の 2 つのボックスの交差部分は (b) の交差部分よりもきれいです。
ここに画像の説明を挿入

2、GIoU(Generalized Intersection over Union)

  • 上記の IoU の欠点を考慮して、GIoU では改良が加えられました。
    ここに画像の説明を挿入
  • C は A と B を含む最小のボックス、つまり 2 つのボックスの外接する四角形です。
    ここに画像の説明を挿入

1. GIoU ペアが互いに素である場合、0 ではないため、GIoU loss = 1 を使用します - GIoU は勾配バックプロパゲーションを実行できます 2. GIoU は 2 つの交差を反映できます。ペアがより
整列している場合、たとえば、GIoU は大きくなります。上の2 番目の図
3 では、GIoU は pred と GT の間の距離をよりよく反映しています。
ここに画像の説明を挿入

3、ディオウ

  • DIoU は主に次の状況を考慮します。
    ここに画像の説明を挿入
  • つまり、pred は完全に GT の内側にあり、IoU と GIoU は同じであり、pred の中心が GT の中心に近いかどうかは判断できません。
  • したがって、DIoU 損失には、IoU 損失に基づく距離ペナルティ項が導入されます。これは次のように定義されます。
    ここに画像の説明を挿入
  • 上記の損失関数では、b と bgt はそれぞれアンカー ボックスとターゲット ボックスの中心点を表し、$$ は 2 つの中心点間のユークリッド距離の計算を表します。c は、アンカーとターゲット フレームの両方をカバーできる最小の長方形の対角距離を表します。これは、次の図に示すように、正規化: d/c に相当します。
    ここに画像の説明を挿入

1. GIoU 損失と同様に、DIoU 損失がターゲット フレームと交差しない場合、勾配は 0 ではないため、最適化できます。
2. より高速な収束: DIoU 損失は 2 つのターゲット ボックス間の距離を直接最小化できますが、GIOU 損失は 2 つのターゲット ボックス間の領域を最適化するため、GIoU 損失よりもはるかに高速に収束します。
3. 水平方向と垂直方向に 2 つのボックスがある場合、DIoU 損失により回帰が非常に高速になる可能性があり、GIoU 損失はほぼ IoU 損失に縮退します。

  • DIoU は、GT と pred の間の距離、オーバーラップ率、スケールを考慮して、GIoU よりも bbox 回帰メカニズムと一致しているため、ターゲット フレーム回帰がより安定し、IoU のようにトレーニング中に発散しません。そしてGIoUの質問。

4、CIoU

  • pred と GT の間のアスペクト比も非常に重要であることを考慮して、CIOU Loss ではボックス アスペクト比ペナルティ項を導入しています。
    ここに画像の説明を挿入
    ここに画像の説明を挿入

参考リンク:https://blog.csdn.net/leonardohaig/article/details/103394369

おすすめ

転載: blog.csdn.net/m0_48086806/article/details/132363118