Fórmula de cálculo do valor F1:
O denominador de Recall (TP + FN) pode ser entendido como: o número de exemplos positivos no rótulo da amostra real;
O valor F1 está relacionado a TP, FP e FN, onde os significados de TP, FP e FN são:
PT | O modelo prevê que o rótulo dos dados é um exemplo positivo, e o verdadeiro rótulo dos dados também é um exemplo positivo; |
PF | O modelo prevê que o rótulo dos dados é um exemplo positivo, mas o rótulo verdadeiro dos dados é um exemplo negativo; |
FN | O modelo prevê que o rótulo dos dados é um exemplo negativo, mas o rótulo verdadeiro dos dados é um exemplo positivo; |
Quanto maior o valor de F1, maior será a precisão e a recuperação necessárias; quanto maior o valor da precisão, menor será o valor necessário; quanto maior o valor da recuperação, menor será o valor necessário , ou seja , maior será o valor de TP, e maior será o valor de F1. menores os valores de FP e FN .
Observe este valor primeiro. A partir das descrições de TP e FN nas tabelas acima, podemos saber que os dois estão relacionados. Um valor FN pequeno significa que o modelo pode prever mais casos reais. Sim, o valor de TP torna-se maior, indicando que o valor Recall está em questão. O modelo prevê os dados do caso real ; em seguida, observe esse valor, quanto menor o FP, menos dados falsos positivos o modelo prevê e menos dados falsos positivos significa que o modelo pode prever mais dados verdadeiros negativos.Portanto, o valor de Precisão presta atenção à situação do modelo que prevê os dados verdadeiros negativos . Através destas análises, podemos ver que o valor F1 presta atenção à previsão do modelo de dados positivos e negativos.Para aumentar o valor F1, é necessário prever os dados positivos e negativos da forma mais correta possível. Portanto, o valor F1 pode ser utilizado como um importante indicador para medir o desequilíbrio das categorias.
Vamos entender por outro ângulo, partindo da fórmula de Precisão e Recall sem nenhuma transformação.
O denominador da Precisão (TP + FP) pode ser entendido como: a quantidade de dados positivos previstos pelo modelo; se o valor da Precisão quiser ficar maior, o denominador precisa ser menor, e quanto menor o denominador, o falso positivo ( O valor de FP) precisa ser menor, o que significa que isso significa que o modelo precisa ser capaz de prever corretamente os dados do rótulo real como um exemplo negativo como um exemplo negativo, o que mostra que a Precisão presta atenção à situação em que o modelo prevê os verdadeiros dados de exemplo negativos.
O denominador de Recall (TP + FN) pode ser entendido como: o número de exemplos positivos no rótulo da amostra real. Este valor é um valor fixo. Se o valor de Recall quiser aumentar, TP precisa ser maior e TP maior significa que o modelo precisa ser capaz de prever corretamente os dados cujo rótulo verdadeiro é positivo, tanto quanto possível, o que mostra que Recall presta atenção à situação em que o modelo prevê dados verdadeiros.
Como calcular o valor F1 na tarefa de multiclassificação? Consulte este artigo: Cálculo do valor F1 em tarefas de multiclassificação