Por que a pontuação F1 pode ser usada como um indicador importante para medir tarefas de desequilíbrio de classe?

Fórmula de cálculo do valor F1:

Conta = \frac{TP +TN}{TP+TN+FP+FN}

Precisão=\frac{TP}{TP+FP} = \frac{1}{1+\frac{FP}{TP}}

 Lembre-se=\frac{TP}{TP+FN}=\frac{1}{1+\frac{FN}{TP}}

O denominador de Recall (TP + FN) pode ser entendido como: o número de exemplos positivos no rótulo da amostra real;

F1=\frac{2*Precisão*Recuperação}{Precisão+Recuperação}=\frac{2}{\frac{1}{Precisão}+\frac{1}{Recuperação}} 

O valor F1 está relacionado a TP, FP e FN, onde os significados de TP, FP e FN são:

PT O modelo prevê que o rótulo dos dados é um exemplo positivo, e o verdadeiro rótulo dos dados também é um exemplo positivo;
PF O modelo prevê que o rótulo dos dados é um exemplo positivo, mas o rótulo verdadeiro dos dados é um exemplo negativo;
FN O modelo prevê que o rótulo dos dados é um exemplo negativo, mas o rótulo verdadeiro dos dados é um exemplo positivo;

        Quanto maior o valor de F1, maior será a precisão e a recuperação necessárias; quanto maior o valor da precisão, menor será \frac{FP}{TP}o valor necessário; quanto maior o valor da recuperação, menor será o valor necessário \frac{FN}{TP}, ou seja , maior será o valor de TP, e maior será o valor de F1. menores os valores de FP e FN .

        Observe \frac{FN}{TP}este valor primeiro. A partir das descrições de TP e FN nas tabelas acima, podemos saber que os dois estão relacionados. Um valor FN pequeno significa que o modelo pode prever mais casos reais. Sim, o valor de TP torna-se maior, indicando que o valor Recall está em questão. O modelo prevê os dados do caso real ; em seguida, observe \frac{FP}{TP}esse valor, quanto menor o FP, menos dados falsos positivos o modelo prevê e menos dados falsos positivos significa que o modelo pode prever mais dados verdadeiros negativos.Portanto, o valor de Precisão presta atenção à situação do modelo que prevê os dados verdadeiros negativos . Através destas análises, podemos ver que o valor F1 presta atenção à previsão do modelo de dados positivos e negativos.Para aumentar o valor F1, é necessário prever os dados positivos e negativos da forma mais correta possível. Portanto, o valor F1 pode ser utilizado como um importante indicador para medir o desequilíbrio das categorias.

        Vamos entender por outro ângulo, partindo da fórmula de Precisão e Recall sem nenhuma transformação.

O denominador da Precisão (TP + FP) pode ser entendido como: a quantidade de dados positivos previstos pelo modelo; se o valor da Precisão quiser ficar maior, o denominador precisa ser menor, e quanto menor o denominador, o falso positivo ( O valor de FP) precisa ser menor, o que significa que isso significa que o modelo precisa ser capaz de prever corretamente os dados do rótulo real como um exemplo negativo como um exemplo negativo, o que mostra que a Precisão presta atenção à situação em que o modelo prevê os verdadeiros dados de exemplo negativos.

O denominador de Recall (TP + FN) pode ser entendido como: o número de exemplos positivos no rótulo da amostra real. Este valor é um valor fixo. Se o valor de Recall quiser aumentar, TP precisa ser maior e TP maior significa que o modelo precisa ser capaz de prever corretamente os dados cujo rótulo verdadeiro é positivo, tanto quanto possível, o que mostra que Recall presta atenção à situação em que o modelo prevê dados verdadeiros.

Como calcular o valor F1 na tarefa de multiclassificação? Consulte este artigo: Cálculo do valor F1 em tarefas de multiclassificação

Acho que você gosta

Origin blog.csdn.net/qq_43775680/article/details/131438402
Recomendado
Clasificación