ディレクトリ
1.精度(正確さ)
正解率は占有正しい結果を予測我々のモデルの割合を指します。
精度の定義は、以下のようにすることを公式のポイント:
$精度= \ FRAC {正しい予測の数} {予測の合計数} $
バイナリ分類精度のために、正および負のカテゴリ分類に応じて次のように計算することができます。
$精度= \ FRAC {TP + TN} {TP + TN + FP + FN} $
、TP =真陽性、TN =真の陰性の場合、FP =偽陽性の場合、FNは偽陰性の例を=。
たとえば、次のモデルは、ストリーム100トール(n型)又は非Torの(負のカテゴリ)に分割されています。
$精度= \ FRAC {TP + TN} {TP + TN + FP + FN} = \ FRAC {1 + 90}、{1 + 90 + 1 + 8} = 0.91 $
精度は0.91、すなわち91%(正確に予測91と100個のサンプルの合計)でした。
しかし、慎重に正と負例の割合を考え、それは明らかに十分な占いではありません。例えば、私は910例が長いモデルは、すべてのサンプル負の例を学び、正解率は91%に達することができる予測していないだろうが、決してこのような肯定的な場合を検出することができないようとして、陰性であったの1000個のサンプルを、持っています。
(例えば、正および負のカテゴリラベルのカテゴリラベルの数との間に有意な差が存在するような)不平衡分類データセットを使用してときに、単独で、正解率は、全体の状況を反映していません。
パート3では、我々は、2つの良くすることができます紹介します分類不均衡を評価リコールと精度率:指標を。
2.リコール(想起= TPR)
リコールは、正のサンプルが正しく陽性率カテゴリとして同定されたすべてのカテゴリを示します。
以下のように数学的には、リコールの定義は以下のとおりです。
$リコール= \ FRAC {TP} {TP + FN} $
レッツは、リコール・フロー・クラシファイア(例えば、上記)を計算します。
$リコール= \ FRAC {TP} {TP + FN} = \ FRAC {1} {1 + 8}は0.11 $を=
モデルのリコールが言っていること、0.11である、モデルが正しく、すべてのTorトラフィックの割合は11%で識別することができます。
3.正確な比率(精密)
正解率は、実際のクラスを正として識別され、正のサンプルカテゴリーの割合を示します。
次のように正解率が定義されました:
$精度= \ FRAC {TP} {TP + FN} $
レッツ・計算フロー分類器(例えば、上記)の正確な割合は、次のとおりです。
$精度= \ FRAC {TP} {TP + FN} = \ FRAC {1} {1 + 1} = 0.5 $
0.5の正確なモデルは、すなわち、トラフィックのTorを予測するモデルの精度は50%です。
参考:httpsの:? //Developers.google.com/machine-learning/crash-course/classification/precision-and-recall HL = ZH-CN
リコールと精度率との関係4。
情報検索の分野では、リコールと精度率としても知られてリコールと精度:
- 関連再現率=検索された情報/システムに関連する情報の量
- =総精度情報は、関連情報を検索/取得します
それは理解することができます。
- また、偽陰性として知られている偽陰性例(FN)、
- また、偽陽性として知られている偽陽性例(FP)、
誤警報率(FPR)と偽陰性率(FNR)
例実質金利TPR = TP /(TP + TN)
彼が正しい比率を予測(予測が「正」である)を選抜していると言われ、正しい(予測値=真値)合計。
とにかくFPR = FP /(FP + TN)の一実施形態
彼は(予想は「正」です)白羽ことを言ったが、総予測誤差率の間違った(予測値!= Trueの値)。
TPRが大きく、より多くの可能性が高いことが白羽の(正しい)、FPRが大きい、より多くの選択プロセスの間に(不可能、その後は、新たな、そして正確であると考えられ、されるより選び出す選び出しますあなたは)間違っを選ぶことがあります。
TNR(真陰性率)は全て、抗クラスとして理解することができ、以下のように定義が与えられると、(抗クラス予測が正しい)番号等があると予測されます。
FNR(False Negative Rate)可以理解为所有正类中,有多少被预测成反类(反类预测错误),给出定义如下:
误报率(FPR)、漏报率(FNR)