¿Por qué no ir bien en la identificación de áreas?
La razón es que la propia definición de Softmax, es oficialmente la función softmax más la pérdida de entropía cruzada. El objetivo es tener el número máximo de todas las clases de espacio en la probabilidad probabilidad de asegurar que todas las categorías se clasifican correctamente, así como las tareas de revocación y validación necesita es un espacio métrico mejor rendimiento generalización. Un espacio métrico, para garantizar la correcta clasificación y para asegurar una buena generalización. Aunque la correlación es muy fuerte, pero no directamente al mismo.
Softmax capaces de amplificar la diferencia entre la categoría de menor importancia logit
pérdida focal
datos de dificultad de diferentes de formación: La motivación
métodos: reducción de separar fácilmente la pérdida de peso de la muestra
pérdida de centro
Motivación: reducción de la clase distancia
método: para cada muestra disminuye desde el centro del cuadrado de la clase distancia
del método de actualización centros de clase: En cada uno de los centro de la agrupación mini-lote actualizado. la pérdida de la clase a la muestra del centro.
pérdida centro contrastivo
Motivación: reducir la distancia entre las clases al mismo tiempo el aumento de la distancia basada en
el método: la distancia entre las clases pequeñas de penalización, el denominador es la distancia entre la misma forma distancia del punto central de las diferentes clases.
la pérdida del anillo
motivación: típico de red normalizado, normalizado o de peso puede controlar el grado de atención a simple o muestras difíciles en cierta medida. punto específico, si no restringida, de modo que la red siempre características deseables de una sola longitud y un mayor peso de la muestra, y la dificultad del modelo correcto y el peso de la muestra es pequeño. Cuando la misma norma vector de características, el ángulo margen máximo.
Método: normalizado característica
serie de pérdida de arcface
L-softmax
Desde
equivalente softmax a
dos límites, provoca una mayor distancia entre el aprendizaje basado en la red, funciones dentro de la clase menor distancia.