免責事項:以下の内容はすべて私の個人的な意見ですので、ご不明な点がございましたら、お気軽に修正してください。
AP (平均精度) は、ターゲット検出における一般的な指標です。
1. 適合率と再現率
AP について言えば、精度と再現率について言及する必要があります。まずは計算式を見てみましょう
正確さ:
再現率:
このうち、TP、FP、FN は混同行列に由来しますが、ここでは混同行列の定義は示しませんので、これらの変数の定義については直接説明します。
TP: 検出器によって出力された結果の正しい数
FP: 検出器出力結果のエラー数
FN: グラウンド トゥルース内の未発見のアイテムの数、FN = グラウンド トゥルースの総数 - TP
適合率の分母部分は、検出器によって検出されたこのカテゴリのフレームの総数であり、再現率の分母部分は、グランド トゥルースによって与えられるこのカテゴリのフレームの総数であることがわかります。
つまり、平たく言えば、適合率は、検出器によって検出されたフレームのうち何個が正しいかを示し、誤検出の程度を測定します。再現率は、検出器によって検出された正しいフレームがグラウンド トゥルースの何パーセントを占めているかを示し、検出漏れの程度を測定します。
例えば:
特定のカテゴリの検出器出力には 5 つのボックスがあり、そのうち 3 つは正しく、2 つは間違っています。この画像にはこのカテゴリに 10 個のボックスがあります。
利用可能: TP = 3、FP = 2、FN = 7
正確さ
再現率
次の 2 つの極端な状況が想像できます。
検出器に膨大な数のターゲット フレームが与えられると、すべてのグラウンド トゥルースを簡単に見つけ出し、広い網を張ります。その場合、再現率は 100% になり、適合率は非常に低くなります。
検出器が 1 つのターゲットのみを検出し、このターゲットは正しいが、グランド トゥルースには 10 個のターゲットがある場合。その場合、適合率は 100% になり、再現率は非常に低くなります。
これら 2 つの状況から、精度と再現率の間には一定の矛盾があることがわかります。
それで、精度と再現率を組み合わせることができるインジケーターはありますか?その場合、APがステージに登場します〜
2.PR曲線
AP の多くの定義では、AP は PR 曲線の曲線下の面積であるとされています。では、PR 曲線とは何でしょうか? どのように描かれているのでしょうか?
PR 曲線は適合率-再現率曲線です。例を使用して説明すると、その描画プロセスはより簡単になります。この例は (ターゲット検出における AP, mAP ) からのものです。以下の例に関連する図もここからのものです。侵害がある場合は、自分の描画を削除しました...
画像内に検出されるターゲットが 5 つあり、検出器が 10 個のボックスを与えるとします。ボックスの信頼度の高い順に並べ替えると、次の結果が得られます。表(写真):
表において、Rank 列は信頼度の高い順に並べたボックスの順序番号を表し、Correct はボックスが正しいかどうかを表し、Precision は計算された適合率を表し、Recall は計算された再現率を表します。
適合率と再現率の計算は、ボックスごとに独立しているのではなく、継続的な累積プロセスです。
例えば:
最初のボックスでは、精度 = 1/1 =1.0、再現率 = 1/5 = 0.2、
2 番目のボックスでは、精度 = 2/2 = 1.0、再現率 = 2/5 = 0.4、
3 番目のボックスでは、適合率 = 2/3 = 0.67、再現率 = 2/5 = 0.4、
……
現時点では、適合率と再現率に基づいて PR 曲線を描くことができます。
このとき、曲線の曲線下の平均面積に等しい平均正解率を見つける必要があります。
3.APの計算
上記の説明から、AP の計算は非常に簡単であることがわかりますが、曲線の下の面積を求めることは積分に似ています。データは離散的であるため、サンプリングポイントを設定するのが一般的で、横軸は0~1の範囲で平均して10または100のセグメントに分割され、最終的にサンプリングされた値を加算してサンプリングポイントの数で割ります。 。ほとんどの標準では、計算を容易にするために曲線が平滑化され、補間の問題がなくなりました。
4.地図
mAP インジケーターは、マルチ カテゴリのターゲット検出タスクで確認できます。m は平均値で、すべてのカテゴリの平均 AP を指します。