1. Como se muestra en la siguiente figura

inserte la descripción de la imagen aquí

exactitud

$\text { precisión }=\frac{T P+TN}{T P+T N+F P+FN}$ La precisión se refiere a la relación entre el número de muestras pronosticadas correctamente y el número total de muestras pronosticadas. No considera si las muestras pronosticadas son positivas o negativas, sino que considera todas las muestras.

precisión (índice de precisión)

$\text { precisión }=\frac{TP}{T P+FP}$

La precisión se refiere a la relación entre el número de muestras positivas pronosticadas correctamente y el número de todas las muestras positivas pronosticadas, es decir, cuántas de todas las muestras positivas pronosticadas son muestras positivas verdaderas. De esto podemos ver que la precisión solo presta atención a la parte que se predice como una muestra positiva.

recuerdo (tasa de recuerdo)

$\text { recordar }=\frac{TP}{T P+FN}$

Se refiere a la relación entre el número de muestras positivas predichas correctamente y el número total de muestras positivas reales, es decir, cuántas muestras positivas puedo averiguar correctamente a partir de estas muestras.

Puntuación F

$F-\text { puntuación }=\frac{2}{1 / \text { precisión }+1 / \text { recordar }}$ F-score es equivalente al promedio armónico de precisión y recuperación, y la intención es hacer referencia a dos indicadores. Podemos ver en la fórmula que si cualquier valor de recuperación y precisión disminuye, la puntuación F disminuirá y viceversa.

especificidad

$\text { especificidad }=\frac{TN}{T N+FP}$ El indicador de especificidad no se ve a menudo, es relativo a la sensibilidad (recall), que se refiere a la relación entre el número de muestras negativas correctamente predichas y el número total de muestras negativas reales, es decir, cuántas de ellas puedo encontrar correctamente. de estas muestras?Muestras negativas.

sensibilidad (TPR)

$\text { sensibilidad }=\frac{TP}{T P+FN}=\text { recordar }$

curva PR

Ponemos el eje vertical a precisión, el eje horizontal a recuperación, y cambiamos el umbral para obtener una serie de pares y dibujar una curva. Para el efecto de predicción de diferentes modelos en el mismo conjunto de datos, podemos dibujar una serie de curvas PR. En general, si una curva "rodea" completamente a la otra, podemos considerar que ese modelo clasifica mejor que el modelo de comparación.

Como se muestra en la siguiente figura:
inserte la descripción de la imagen aquí
Indicadores bajo desequilibrio muestral

fondo:

En la mayoría de los casos, los costos de clasificación de las diferentes categorías no son iguales, es decir, no se puede comparar el costo de clasificar las muestras como ejemplos positivos o negativos. Por ejemplo, en el filtrado de spam, esperamos que los correos electrónicos importantes nunca se consideren como spam, y en la detección del cáncer, preferimos juzgar mal que fallar. En este caso, no es suficiente usar la tasa de error de clasificación como una métrica sola, ya que tal error métrico oculta el hecho de cómo se clasificó erróneamente la muestra. Por lo tanto, en la clasificación, cuando la importancia de una determinada categoría es más alta que otras categorías, puede usar Precisión y Recuperación de múltiples indicadores nuevos que son mejores que la tasa de error de clasificación.

roc (Curva característica de funcionamiento del receptor)

El desequilibrio de clases a menudo ocurre en conjuntos de datos reales, es decir, hay muchas más muestras negativas que muestras positivas (o viceversa), y la distribución de muestras positivas y negativas en los datos de prueba también puede cambiar con el tiempo. En este caso, la curva ROC puede permanecer sin cambios. Al mismo tiempo, podemos afirmar que cuanto más cerca esté la curva ROC de la esquina superior izquierda, mejor será el rendimiento del clasificador, lo que significa que el clasificador obtiene una alta tasa de verdaderos positivos mientras que la tasa de falsos positivos es muy baja.

El siguiente es un ejemplo de una curva ROC:
inserte la descripción de la imagen aquí
donde la abscisa de la curva es la tasa de falsos positivos (False Positive Rate, FPR), N es el número de muestras negativas reales y FP es la muestra positiva predicha por el clasificador entre las N muestras negativas El número de , P es el número de muestras reales. donde $\frac{FP}{FP + TN}$ , $TPR=\frac{TP}{TP+FN}$ 。

Por ejemplo, si hay 20 muestras para 2 clasificaciones, los resultados de la clasificación son los siguientes:
inserte la descripción de la imagen aquí
ahora especificamos un umbral de 0,9, luego solo la primera muestra (0,9) se clasificará como un ejemplo positivo y todas las demás muestras se clasificarán como Clasificado como un ejemplo negativo, por lo tanto, para el umbral de 0,9, podemos calcular que el FPR es 0 y el TPR es 0,1 (porque hay un total de 10 muestras positivas y el número de predicciones correctas es 1), entonces sabemos que debe haber un punto en la curva es (0, 0.1). Seleccione diferentes umbrales (o "puntos de truncamiento") a su vez, dibuje todos los puntos clave y luego conecte los puntos clave para finalmente obtener la curva ROC como se muestra en la figura a continuación.

inserte la descripción de la imagen aquí
De hecho, existe una forma más intuitiva de dibujar la curva ROC, que es establecer el intervalo de escala del eje horizontal en $\frac{1}{N}$ , el intervalo de escala del eje vertical se establece en $\frac{1}{P}$ , N, P son el número de muestras negativas y muestras positivas respectivamente. Luego, organice en orden descendente de acuerdo con los resultados de salida del modelo, recorra las muestras por turnos y dibuje la curva ROC comenzando desde 0. Cada vez que se encuentra una muestra positiva, se dibuja una curva con un intervalo de escala a lo largo del eje vertical, y cada vez que se encuentra una muestra negativa, es a lo largo del eje horizontal.Dibuje una curva con un intervalo de escala.Después de atravesar todos los puntos de la muestra, se dibuja la curva.

Dibujo de la curva ROC usando sklearn:

>>> from sklearnimport metrics
>>> import numpy as np
>>> y = np.array([1, 1, 2, 2]) #假设4个样本
>>> scores = np.array([0.1, 0.4, 0.35, 0.8])
>>> fpr, tpr, thresholds = metrics.roc_curve(y, scores, pos_label=2)
>>> fpr #假阳性
array([ 0. ,  0.5,  0.5,  1. ])
>>> tpr #真阳性
array([ 0.5,  0.5,  1. ,  1. ])
>>> thresholds #阈值
array([ 0.8 ,  0.4 ,  0.35,  0.1 ])
>>> #auc(后面会说)
>>> auc = auc = metrics.auc(fpr, tpr)
>>> auc
0.75

Trace la curva:

import matplotlib.pyplot as plt
plt.figure()
lw = 2
plt.plot(fpr, tpr, color='darkorange',
         lw=lw, label='ROC curve (area = %0.2f)' % auc)
plt.plot([0, 1], [0, 1], color='navy', lw=lw, linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver operating characteristic example')
plt.legend(loc="lower right")
plt.show()

La imagen dibujada es como se muestra en la figura:
inserte la descripción de la imagen aquí
9. auc(Área bajo la curva)

auc se refiere al área de la roc calculada. El valor AUC es un valor de probabilidad. Cuando selecciona aleatoriamente una muestra positiva y una muestra negativa, la probabilidad de que el algoritmo de clasificación actual clasifique la muestra positiva por delante de la muestra negativa de acuerdo con el valor de Puntuación calculado es el valor AUC. Cuanto mayor sea Valor de AUC, mayor será la clasificación actual.Cuanto más probable sea que el algoritmo clasifique las muestras positivas por delante de las muestras negativas, mejor podrá clasificar.

def AUC(label, pre):
　　"""
　　适用于ｐｙｔｈｏｎ3.0以上版本
   """
　　#计算正样本和负样本的索引，以便索引出之后的概率值
    pos = [i for i in range(len(label)) if label[i] == 1]
    neg = [i for i in range(len(label)) if label[i] == 0]
 
    auc = 0
    for i in pos:
        for j in neg:
            if pre[i] > pre[j]:
                auc += 1
            elif pre[i] == pre[j]:
                auc += 0.5
 
    return auc / (len(pos)*len(neg))
 
 
if __name__ == '__main__':
    label = [1,0,0,0,1,0,1,0]
    pre = [0.9, 0.8, 0.3, 0.1, 0.4, 0.9, 0.66, 0.7]
    print(AUC(label, pre))

Por supuesto, la fórmula también se puede usar para el cálculo: $NAUC=\frac{\sum_{i \in \text { clasepositiva }} \operatorname {rango }_{i}-\frac{M(1+M)}{2}}{M \veces N}$

el código se muestra a continuación:

import numpy as np
def auc_calculate(labels,preds,n_bins=100):
    postive_len = sum(labels)
    negative_len = len(labels) - postive_len
    total_case = postive_len * negative_len
    pos_histogram = [0 for _ in range(n_bins)]
    neg_histogram = [0 for _ in range(n_bins)]
    bin_width = 1.0 / n_bins
    for i in range(len(labels)):
        nth_bin = int(preds[i]/bin_width)
        if labels[i]==1:
            pos_histogram[nth_bin] += 1
        else:
            neg_histogram[nth_bin] += 1
    accumulated_neg = 0
    satisfied_pair = 0
    for i in range(n_bins):
        satisfied_pair += (pos_histogram[i]*accumulated_neg + pos_histogram[i]*neg_histogram[i]*0.5)
        accumulated_neg += neg_histogram[i]

    return satisfied_pair / float(total_case)
 
 y = np.array([1,0,0,0,1,0,1,0,])
 pred = np.array([0.9, 0.8, 0.3, 0.1,0.4,0.9,0.66,0.7])
print("----auc is :",auc_calculate(y,pred))

AUROC (Área bajo la curva característica de operación del receptor)

La mayoría de las veces, AUC se refiere a AUROC, lo cual es una mala práctica, AUC tiene ambigüedad (podría ser cualquier curva), mientras que AUROC no tiene ambigüedad.

El resto son consistentes con AUC.

2. Resumen de indicadores de segmentación de imágenes

precisión de píxeles (marcados correctamente/número total de píxeles)

En aras de la explicación, suponga lo siguiente: un total de $k + 1$ clase (desde $L_{0}$ a $L_{k}$ , que contiene una clase vacía o un fondo), $p_{ij}$ Indica que pertenece a la clase $pero$ predije como claseEl número de píxeles para $j .$ Es decir, $p_{ii}$ Indica la muestra positiva verdadera, y $p_{ij},p_{ji}$ Las representaciones se interpretan como falsos positivos y falsos negativos, respectivamente.

Su fórmula de cálculo es la siguiente: $\frac{\sum_{0}^{k}p_{ii}}{\sum_{i=0}^ {k}\sum_{j=0}^{k}p_{ij}}$
en la imagen $k + 1$ , $P_{ii}$ Indica que el la clase $i$ $El número de píxeles de clase i$ (el número de píxeles clasificados correctamente), $P_{ij}$ Indica que el La clase $i$ $El número de píxeles de clase j$ (el número de todos los píxeles)
, por lo que la relación representa la proporción de píxeles correctamente clasificados con respecto al número total de píxeles.

Para $En lo que respecta$ $a PA$ , ¡la ventaja es la simplicidad! Desventajas: si una gran área de la imagen es el fondo y el objetivo es pequeño, incluso si la imagen completa se predice como fondo, habrá una puntuación de PA alta, por lo que este indicador no es adecuado para evaluar la segmentación de la imagen. efecto de objetivos pequeños.

MPA (Precisión media de píxeles)

Su fórmula de cálculo es la siguiente: $\frac{1}{1+K}\sum_{0}^{k}\frac{p_{ii}} {\ suma_{j=0}^{k}p_{ij}}$

¡Calcule la precisión de cada categoría y tome la media!

MIou (Intersección media sobre unión)

Calcula la razón de la intersección a la unión de dos conjuntos, en segmentación semántica, los valores verdadero y predicho. $U=\frac{1}{k+1} \sum_{i=0}^{k } \frac{p_{ii}}{\sum_{j=0}^{k} p_{ij}+\sum_{j=0}^{k} p_{ji}-p_{ii}}$

FWIoU (intersección ponderada en frecuencia sobre la unión)

Una mejora de MIou, este método puede establecer pesos para cada clase según su frecuencia de ocurrencia: $U=\frac{1}{\sum_{i=0}^{k} \sum_{j=0}^{k} p_{ij}} \sum_{i=0}^ {k } \frac{p_{ii}}{\sum_{j=0}^{k} p_{ij}+\sum_{j=0}^{k} p_{ji}-p_{ii}}$

3. Resumen de indicadores de detección de objetivos

Se utilizan principalmente los siguientes indicadores:

$m A P$ : $P re c i s i ó n m e n i a p a r i a$ , es decir, cada categoría $AP$ $AP Promedio$ AP
$A P$ : $El área bajo la curva PR$ se explicará en detalle más adelante
$PR$ 曲线: $Precisión______- R ec a ll$ 曲线
$Precisión______: TP / (TP + FP)$
$R ec todo_: TP / (TP + FN)$
$TP : yo o tu >$ El número de marcos de detección de $0.5$ $La verdad del terreno se$ calcula solo una vez) $FP$ $IoU$ $<$ $=$ $0,5$
$FP : yo o tu <= 0,5$ fotogramas de detección, o detectar el mismoEl número de marcos de detección redundantes de $GT$
$FN$ : Número de GTs no detectados
$I O U$ : Calcular el cociente de la intersección y unión de dos conjuntos
$NMS$ de supresión no máxima
Cálculo $de$ $AP$

Para calcular $A P$ , lo primero que hay que calcular es $TP, FP, FN$ .

Para una sola imagen, primero atraviese $básica$ $verdad$ $_$ $_$ $_$ $t r u t h$ de una categoría que queremos calcular $g t$ $o bj ec t s$ , luego lea el marco de detección de esta categoría detectada por el detector (no se preocupe por otras categorías), y luego filtre el puntaje de confianza más bajo que el umbral de confianza, y algunos umbrales de confianza no están establecidos. Ordene los marcos de detección restantes de acuerdo con el puntaje de confianza de mayor a menor, y primero juzgue el marco de detección con el puntaje de confianza más alto y $g t$ $bb o x$ 的 $yo o tu$ si o $yo o tu$ 嘈值, joven $i o u$ es mayor que el conjunto $El umbral i o u$ se juzga como $TP$ , pon este $gt_bbox$ como detectada (posterior mismo $GT$ Los marcos de detección redundantes de $GT$ $FP$ , por lo que primero se ordena de mayor a menor según la puntuación de confianza, y el marco de detección con la puntuación de confianza más alta va primero a $i o u$ umbral de comparación, si es mayor que $i o u$ umbral, considerado como $TP$ , siguiente mismoLas cajas de detección de $objetos g$ $t$ $FP$ ), $Si i o u$ es menor que el umbral, es $FP$ . El número total de GT en una determinada categoría en la imagen es fijo, se resta el número de TP y el resto es el número de FN

Cuando hay $tp, FP, Después del valor FN$ , podemos calcular $p rec i s i o n$ 与 $rec todos$ . $_$ Calculando así $AP_$ _

En $Antes de VOC 2010$ , solo necesita seleccionar cuando $1$ $R ec todo_>= 0, 0.1, 0.2, ..., 1$ de $a 11$ pips $Prec i s i ó n máx$ , luego $Una P$ es esto $11$ 个 $Valor medio de Prec i si o n$ .
En $Para VOC 2010$ y posteriores, se requiere Recall para cada $diferente$ $Recuperar valor (incluyendo 0 y 1), seleccionar si es$ mayor o igual a $estos$ $Recuperar$ en el $valor R$ $ec$ $a$ $ll$ $Precisión valor máximo$ luego $calcular$ $PR$ $PR$ $_$ Área bajo la $curva PR$ $Un$ valor $P.$
$Conjunto de datos de COCO$ , conjunto de varios $I O U$ Umbral ( $0.5 - 0,95$ , $0,05$ es el tamaño de paso), en cadaumbral $I$ $O$ $U$ $Un valor P$ , y luego encontrar diferentesen el $Umbral I$ $O$ $U$ $Un promedio de P$ final $Un$ valor $P.$
Cálculo $de$ $m$ $AP$

Como sugiere el nombre, todas las clases de $Un valor P$ promedio es $m A P$ 。

4. Medición de la eficiencia del modelo

FLOP (operaciones de punto flotante)

Se supone que la implementación de la operación de convolución tiene la forma de una ventana deslizante y la función no lineal no consume recursos informáticos. Luego, para $F L OP s$ 为： $2HW(C_{in}K^{2}+1)C_{out}$ donde $H$ , $W$ 与 $C_{in}$ es la altura, el ancho y el número de canal de las entidades de entrada, $K$ es el ancho y la longitud del kernel de convolución, $C_{out}$ es el número de canales de salida. Al mismo tiempo, se supone que el tamaño de la entrada y la salida es el mismo.

Para capas totalmente conectadas: $F L OP s = (2I_- 1) O$ , $I$ es la dimensión de la entrada, $O$ es la dimensión de salida.

Cálculo de métricas de aprendizaje automático

1. Como se muestra en la siguiente figura

Supongo que te gusta