YoloV8 改善戦略: Shape-IoU、境界形状とスケールの測定を考慮

まとめ

この記事では、最新の Shape-IoU を使用して YoloV8 を改善し、私自身のデータセットの増加を達成することを試みます。

論文: 「Shape-IoU: 境界線の形状とスケールを考慮したメトリクス」

https://arxiv.org/pdf/2312.17663.pdf
検出器位置特定ブランチの重要な部分として、境界ボックス回帰損失は物体検出タスクにおいて重要な役割を果たします。既存のバウンディング ボックス回帰手法は通常、グラウンド トゥルース ボックス (GT ボックス) と予測ボックスの間の幾何学的関係を考慮し、バウンディング ボックスの固有の特性を無視しながら、バウンディング ボックスの相対的な位置と形状を使用して損失を計算します (形状やスケールなど).) 境界ボックス回帰について。既存の研究の欠点を補うために、この論文ではバウンディングボックス自体の形状とスケールに焦点を当てたバウンディングボックス回帰法を提案します。まず、バウンディング ボックスの回帰特性を分析したところ、バウンディング ボックス自体の形状とスケール係数が回帰結果に影響を与えることがわかりました。上記の結論に基づいて、バウンディング ボックス自体の形状とスケールに焦点を当てて損失を計算し、バウンディング ボックス回帰をより正確にすることができる Shape IoU 法を提案します。最後に、多数の比較実験を通じて私たちの方法を検証しました.実験結果は、私たちの方法が検出パフォーマンスを効果的に向上させ、既存の方法を上回り、さまざまな検出タスクで最先端のパフォーマンスを達成できることを示しています。コードは https://github.com/malagoutou/Shape-IoU で入手できます。

索引用語: 物体検出、損失関数、境界ボックス回帰

1 はじめに

物体検出はコンピュータ ビジョンの基本的なタスクの 1 つであり、その目的は画像内の物体の位置を特定して識別することです。アンカー ポイントが生成されるかどうかに応じて、物体検出はアンカーベースの方法とアンカーレスの方法に分けられます。アンカーベースのアルゴリズムには、Faster R-CNN [1]、YOLO シリーズ (You Only Look Once) [2]、SSD (Single Shot MultiBox Detector) が含まれます。

おすすめ

転載: blog.csdn.net/m0_47867638/article/details/135435658