yolov3 の作者は yolo アルゴリズムの更新から撤退しましたが、yolo の改善はやめませんでした。2020年にはyolov4が発行され、原作者から肯定されました。yolov4 の論文では、多くのトレーニング戦略を使用して比較のために多くのアブレーション実験が行われ、yolov3 と比較して精度が大幅に向上しています。
論文ダウンロードアドレス:https://arxiv.org/pdf/2004.10934
ペーパー コード アドレス: https://github.com/AlexeyAB/darknet
1 はじめに
まずはcocoデータセットでのyolov4のAP値を見てみましょう。これは速度を保証し、進捗状況に言及しています。yolov3と比較するとAP値が10%近くアップしている.yolov4の効果は非常に良いことがわかる.efficiencyDetと比較すると精度は低いが,それをはるかに上回る速度で本物の効果を得ることができる. -時間検出。
yolov4 は、その効果を明確にするためにどのような改善を行いましたか? 同様に、最初にネットワーク アーキテクチャ、トレーニング戦略、およびデータ処理を分析します。まず、ネットワークのアーキテクチャとしては、バックボーンはCSPDarknet53、ネック部分はPANフィーチャーフュージョン、ヘッドはyolov3と同様、1x1コンボリューション出力を採用。トレーニング戦略では、BoF と BoS が使用されます. BoF は、ネットワーク自体のコストを増加させずにネットワークを改善すること、つまり、データの強化. BoS は、ネットワーク アーキテクチャを変更し、ネットワークにいくつかのモジュールを追加して、ネットワーク機能を改善します.
2. ネットワーク アーキテクチャ
2.1バックボーン:
なぜ CSPDarknet53 を使うのか? 筆者が実験したところ、CSPDarknet53 は特徴抽出能力が強く、同時に受容野が大きくパラメータ数が多いという検出面での利点がある。モデルの強力な学習能力。
同時に、SPP モジュールが CSPDarknet53 に追加され、ネットワークの受容フィールドをさらに拡大し、情報の損失を減らします。
2.2 首と頭:
首の部分は、yolov3のFPNを使わず、aをFPN、aとbの和をPANとするパラメータの集約方法として、FPNに比べてダウンサンプリングを1回追加したPANetを使用しています。そして頭はyolov3と同じ
ただし、yolov4 の PAN では add の代わりに concat が使用されます。
yolov4 のネットワーク構造は、上記の 2 つの部分から形成されます。
3. トレーニング戦略
2.1、BoF および BoS
アクティベーション関数には Mish、IOU 損失には CIoU、データ強化には Mosaic、正則化には DropBlock、正規化には CmBN、ラベル スムージングなどを使用します。この一連の改善戦略は、
著者は、上記の実験を通じて使用された戦略の有効性をさらに証明します。yolov4のうち、主に関連する戦略が提案され、yolov3をベースに改良が加えられています。
詳細については、この大物のブログをご覧になることをお勧めします。