ターゲット検出におけるAPとMAPの計算

MAP(平均精度)MAP(平均精度) M A P フラット平均正解

最初に推奨する## https://github.com/rafaelpadilla/Object-Detection-Metrics

これ、ここで言われていることは実際にはかなり明確です。

mAPの計算を実際に理解するには、これらの概念を理解する必要があります

1つは、信頼度とIOUしきい値の概念です。

信頼度とIOUのしきい値を通じて、TPとFPを決定できます。

2.FNの概念を理解する

テストでは、GroundTruth合計の概念を理解する必要があります

3つの適合率と再現率

FN、TP、FPを知ることで、
適合率と再現率を知ることができます。適合率= TP /(TP + FP)
再現= TP /(TP + FN)

いわゆる11点補間表示法を4つ理解


実際、考えてみる価値のある質問があります。なぜリコールを横軸として使用できるのか、リコールは増加するだけで減少しないのでしょうか。

申し訳ありませんが、思い出します。私は本当に上がるだけで、下がることはありません。やりたいことは何でもします。

検出フレームは信頼水準に従って降順でソートされるため、リコールは増加するだけで減少はしません。これは横軸として使用できます。


各予測ボックスの適合率と再現率を理解して計算すると、描画できます准确度x召回率曲线
ここに写真の説明を挿入

11点補間表示方式は、[0、1]領域を10点に均等に分割する方法です。

上の図から、最後に描かれた曲線までのすべての検出フレームがリコール範囲[0-0.5]にあることがわかります。

次に、11点補間表示法を使用して、最初に11点の横座標分布が[0、0.1、0.2、0.3、...、1.0]であることを確認します。

次に、各横軸と上の画像に従って准确度x召回率曲线、下の画像の赤い点の縦座標を決定し、次に下の画像を作成します

ここに写真の説明を挿入

ここに写真の説明を挿入

AP

ここに写真の説明を挿入


適合率と再現率の概念を確立する

精度

精度は、真に正しいサンプルで真であるすべての予測の割合です
(つまり、100個のサンプルが真であると予測したが、真であるのは80個だけである可能性があります。20個の偽がありますが、これらの20個は真であると予測したので、精度は80 /(80 + 20)= 0.8)
ここに写真の説明を挿入

注:100サンプルを予測しました。これらの100サンプルは、元の2000サンプルから選択できます。

想起

リコールとは、予測が正しいサンプルの中で、本当に正しいサンプルの数の割合を指します。

予測が本当に正しいサンプルの数と誤った予測の合計はいくつですか?

200個のサンプルを予測するとします。これらの200個のサンプルのうち、100個を真、100個を偽と予測します。100個のサンプルのうち、80個が真で、予測が真です。偽物は20個あります。偽の100の予測のうち、30は真ですが、予測は偽です。これは、偽の予測の数です。

OK!ここにポイントがあります!

1つは200のサンプルを予測し、予測は真または偽であり、それぞれが100のサンプルに分割されます。
真である100個の予測のうち80個が真であり
、偽である100個の予測のうち、真の真の数、つまり偽の予測の数は30です。

では、予測が本当に正しいサンプルの数と誤った予測の合計はいくつですか?
これは80+ 30であり、これはこれらの200で真に当てはまるサンプルの数です。

ここに写真の説明を挿入

適合率と再現率が競合していると言われるのはなぜですか

ここに写真の説明を挿入
ここに写真の説明を挿入

すべての予測が偽であるため、上記の例をとると、100、100 = FP + FNです。すべての予測の総数が偽の場合、FPは多く、FNは少なく、FNは多く、FPはもっと少なく

検出指数:AP値の計算

第二に、自信とIOUの概念を確立します

  • 信頼度:フレーム領域が必要なオブジェクトである確率
  • IOU:私はすべてを理解しています

ここに写真の説明を挿入


  • 真陽性(TP):IOU> =しきい値検出ボックス
  • 誤検知(FP):IOU <しきい値検出ボックス
  • False Negative(FN):検出されなかったGT
  • 真のネガティブ(TN):無視する

検出指数の計算は信頼水準に基づく必要があります。ここでのIOUしきい値はデフォルトで0.5です。猫の写真のIOU値は、それぞれ0.76、0、0.91と想定されています。

上記のXiaoMiaomiaoが示すように、信頼分布は[0.7、0.8、0.9]です。


信頼度が0.85の場合

信頼水準が0.85の場合、cat3のみが検出されるため、検出ボックスにはcat3に1つのiou = 0.91が残ります。

  • 真陽性(TP):IOU> =しきい値検出ボックス
  • 誤検知(FP):IOU <しきい値検出ボックス
  • False Negative(FN):検出されなかったGT

ここで、iouしきい値= 0.5

TP = 1
FP = 0不合格検査

FN = 2(cat1およびcat2の緑色のボックス)


精度= TP /(TP + FP)=
1/1リコール= TP /(TP + FN)= 1/3


信頼度が0.75の場合

信頼水準が0.75の場合、cat3とcat2が検出されるため、検出ボックスはcat3とcat2でiou = 0.91とiou = 0のままになります。

  • 真陽性(TP):IOU> =しきい値検出ボックス
  • 誤検知(FP):IOU <しきい値検出ボックス
  • False Negative(FN):検出されなかったGT

ここで、iouしきい値= 0.5

TP = 1
FP = 1


不合格検査FN = 2(cat1およびcat2の緑色のボックス)


精度= TP /(TP + FP)=
1/2リコール= TP /(TP + FN)= 1/3


信頼度が0.5の場合

信頼水準が0.5の場合、すべての猫の画像が検出されたと見なされます。cat3、cat2、およびcat1ではiou = 0.91、iou = 0、iou = 0.76です。

  • 真陽性(TP):IOU> =しきい値検出ボックス
  • 誤検知(FP):IOU <しきい値検出ボックス
  • False Negative(FN):検出されなかったGT

ここで、iouしきい値= 0.5

TP = 2
FP = 1


不合格検査FN = 1(cat2の緑色のボックス)


精度= TP /(TP + FP)=
2/3リコール= TP /(TP + FN)= 2/3


実際、上記から、信頼水準またはIOUしきい値が変更されるたびに、TPとFPの再計算、つまり再現率と適合率の再計算が行われることがわかります。


再現率と適合率を使用してAPを計算します

さまざまなリコール値の下での精度値の変化を計算します

注意、注意、それぞれの再現率と適合率は何ですか?

以下の各ポイントのリコール値はどのように決定されますか?
わからない、はははは!
ここに写真の説明を挿入

ここに写真の説明を挿入


https://github.com/rafaelpadilla/Object-Detection-Metrics


適合率と再現率を計算
するには、真陽性が必要です。予測は真ですが、真です。
偽陰性:予測は偽ですが、真であり、見逃されています。

誤検知:予測は真ですが、実際には偽です。
真の負:予測は偽ですが、実際には偽です。


TP + FN =すべてtrue

TP /(TP + FN)=すべての真実の中で、真である予測の割合


TP + FP =すべての予測が正しい


真であるすべての予測の中でTP /(TP + FP)、真の比率


IoU> 0.5の場合は真陽性と見なされ、それ以外の場合は偽陽性と見なされます。


各画像について、グラウンドトゥルースデータは、画像内の各カテゴリのオブジェクトの実際の数を示し、各正の予測ボックスとグラウンドトゥルースのIoU値を計算し、最大のIoU値と見なされる最大のIoU値を取得します。予測ボックスによって検出されたグラウンドトゥルース。次に、IoUしきい値に従って、画像内の各カテゴリの正しい検出値の数(True Positive、TP)と誤検出の数(False Positive、FP)を計算できます。

注意の类别概念

これに基づいて、各类别精度を計算できます

ここに写真の説明を挿入


正しい予測値の数(TruePositives)と見逃されたオブジェクトの数(False Negatives、FN)
は簡単に計算できますリコールは計算できます(分母はグラウンドトゥルースの総数にすることができます)

ここに写真の説明を挿入


オブジェクト検出では、mAPの定義はPASCAL Visual Objects Classes(VOC)コンペティションで最初に登場しました


以下のゴミの話のように感じます、私はそれを読むことができません

ここに写真の説明を挿入

緑の実数ボックス、赤の実数ボックスは予測ボックス、緑の実数ボックス、赤の実数ボックスは予測ボックスです グリーン真の固体ブロック赤い事前測定ブロック

7つの画像があり、そのうち15のグラウンドトゥルースオブジェクトは緑色の境界ボックスで表され、24の検出されたオブジェクトは赤色の境界ボックスで表されます。検出された各オブジェクトは文字(A、B、...、Y)で識別され、信頼性があります

ここに写真の説明を挿入

次に、BBOXを自信を持って並べ替えます

ここに写真の説明を挿入

次に、各BBOXに対応する適合率と再現率の値を計算します

例:

  • 対向BBOXR、精度= 1/1 = 1、リコール= 1/15 = 0.0666
  • BBOXYの場合、精度= 1/2 = 0.5、リコール= 1/15 = 0.0666
  • 対向BBOXJ、精度= 2/3 = -0.666s、リコール= 2/15 = 0.1333

ここに写真の説明を挿入


2012年以降、面積を使用してAP値を概算します

ここに写真の説明を挿入
ここに写真の説明を挿入
ここに写真の説明を挿入


ターゲット検出におけるTP、FP、FN、TNの定義

  • 真陽性(TP):IOU> =しきい値検出ボックス
  • 誤検知(FP):IOU <しきい値検出ボックス
  • False Negative(FN):検出されなかったGT
  • 真のネガティブ(TN):無視する

ここに写真の説明を挿入

ここに写真の説明を挿入


おすすめ

転載: blog.csdn.net/qq_41375318/article/details/112755139