yolov4論文の分析

yolov3 の作者は yolo アルゴリズムの更新から撤退しましたが、yolo の改善はやめませんでした。2020年にはyolov4が発行され、原作者から肯定されました。yolov4 の論文では、多くのトレーニング戦略を使用して比較のために多くのアブレーション実験が行われ、yolov3 と比較して精度が大幅に向上しています。

論文ダウンロードアドレス:https://arxiv.org/pdf/2004.10934

ペーパー コード アドレス: https://github.com/AlexeyAB/darknet


1 はじめに

まずはcocoデータセットでのyolov4のAP値を見てみましょう。これは速度を保証し、進捗状況に言及しています。yolov3と比較するとAP値が10%近くアップしている.yolov4の効果は非常に良いことがわかる.efficiencyDetと比較すると精度は低いが,それをはるかに上回る速度で本物の効果を得ることができる. -時間検出。

 yolov4 は、その効果を明確にするためにどのような改善を行いましたか? 同様に、最初にネットワーク アーキテクチャ、トレーニング戦略、およびデータ処理を分析します。まず、ネットワークのアーキテクチャとしては、バックボーンはCSPDarknet53、ネック部分はPANフィーチャーフュージョン、ヘッドはyolov3と同様、1x1コンボリューション出力を採用。トレーニング戦略では、BoF と BoS が使用されます. BoF は、ネットワーク自体のコストを増加させずにネットワークを改善すること、つまり、データの強化. BoS は、ネットワーク アーキテクチャを変更し、ネットワークにいくつかのモジュールを追加して、ネットワーク機能を改善します.

2. ネットワーク アーキテクチャ

        2.1バックボーン:

                なぜ CSPDarknet53 を使うのか? 筆者が実験したところ、CSPDarknet53 は特徴抽出能力が強く、同時に受容野が大きくパラメータ数が多いという検出面での利点がある。モデルの強力な学習能力。

  同時に、SPP モジュールが CSPDarknet53 に追加され、ネットワークの受容フィールドをさらに拡大し、情報の損失を減らします。

ここに画像の説明を挿入

 

        2.2 首と頭:

                首の部分は、yolov3のFPNを使わず、aをFPN、aとbの和をPANとするパラメータの集約方法として、FPNに比べてダウンサンプリングを1回追加したPANetを使用しています。そして頭はyolov3と同じ

ここに画像の説明を挿入

        ただし、yolov4 の PAN では add の代わりに concat が使用されます。

  yolov4 のネットワーク構造は、上記の 2 つの部分から形成されます。

3. トレーニング戦略

        2.1、BoF および BoS

        アクティベーション関数には Mish、IOU 損失には CIoU、データ強化には Mosaic、正則化には DropBlock、正規化には CmBN、ラベル スムージングなどを使用します。この一連の改善戦略は、

 

 

著者は、上記の実験を通じて使用された戦略の有効性をさらに証明します。yolov4のうち、主に関連する戦略が提案され、yolov3をベースに改良が加えられています。

詳細については、この大物のブログをご覧になることをお勧めします。

YOLOv4ネットワークの詳しい説明

おすすめ

転載: blog.csdn.net/weixin_44711102/article/details/127816150