Simple y crudo a comprender e implementar la lógica de regresión de aprendizaje automático: presentación de regresión logística, escenarios de aplicación, los principios, las pérdidas y optimización ...

Autor | Wang Wenqi

Zebian | Carol

Fuente | Blog RDCC

Producido | AI campamento de base tecnológica (ID: rgznai100)

Objetivos de aprendizaje

Sabemos que la pérdida de la función de regresión logística
Optimización de regresión logística para saber
Sabemos función sigmoide
Usted sabe que el escenario de regresión logística
Solicitud de regresión logística se da cuenta de previsión de regresión logística
Sabemos la diferencia entre los indicadores de precisión, de recuerdo
Sabemos cómo resolver evaluar los desequilibrios en la muestra
curva ROC para comprender el significado de las instrucciones AUC tamaño del índice
Classification_report aplicación precisa, Recall calcula
Indicadores para aplicaciones de computación roc_auc_score

Logistic Introducción regresión

Regresión logística (regresión logística) es una máquina de aprendizaje modelo de clasificación, regresión logística es un algoritmo de clasificación, aunque el nombre con el regreso, pero hay alguna conexión entre él y el retorno. Debido a la simple y eficiente algoritmo es ampliamente utilizado en la práctica.

Logistic escenarios de aplicación de regresión:

CTR
Es el spam
Ya sea por enfermedad
Fraude financiero
cuenta falsa

Ver el ejemplo anterior, podemos ver las características de ellos, eso es todo parte de la sentencia entre las dos categorías. arma de regresión logística es resolver un problema de clasificación binaria.

principio de regresión logística

Para dominar la regresión logística, hay que entender dos cosas:

La regresión logística, ¿cuál es el valor de entrada
Cómo determinar la regresión lógica de salida

1, de entrada

lógica de entrada es el resultado de una regresión lineal de regresión.

2, la función de activación

función sigmoide

criterios

Los resultados de regresión son entrada a la función sigmoide entre
Resultados de salida: [0, 1] valor de un intervalo de probabilidad, el valor umbral predeterminado es 0,5

La clasificación final por regresión logística determina un valor de probabilidad es la pertenencia a una categoría pertenecen a una categoría, y la bandera categoría por defecto es 1 (pacientes positivos), otra categoría están etiquetados 0 (contraejemplo). (Conveniencia Cálculo de pérdidas)

Interpretación de los resultados de salida (importantes): Supongamos que hay dos categorías de A, B, y que asume valor de probabilidad que pertenece a A (1) el valor de probabilidad de esta categoría. Ahora hay una muestra de la entrada a la salida de la regresión logística 0.6, a continuación, el valor de probabilidad es superior a 0,5, medios que tren o predecir el resultado es A (1) categoría. Por el contrario entonces, a continuación, 0,3, o entrenamiento si el resultado se prevé que como resultado de B (0) categoría.

Así regresión lineal para predecir los resultados antes de esa fecha recordamos que utilizamos para medir el error cuadrático medio, que si por regresión logística, predecimos que los resultados no hacen la forma de medir las pérdidas? Nos fijamos en tal una imagen.

Así predicciones acerca de cómo medir los resultados de la regresión logística de la diferencia real?

Las pérdidas y optimización

1 derrota

Pérdida de regresión logística, llamada pérdida de probabilidad logarítmica , la siguiente fórmula:

categorías distintas:

¿Cómo entender que una sola ecuación? Esto debe entenderse en términos de función de registro de imagen

pérdida completa de la función integrada

Ver esta fórmula, de hecho, similar a decirnos entropía de la información.

Entonces traemos el ejemplo anterior se calcula de nuevo, será capaz de entender el significado.

Ya sabemos, log§, cuanto mayor sea el valor de p, cuanto menor sea el resultado, así que podemos mirar a esta fórmula para analizar la pérdida

2, la optimización

También el uso de un algoritmo de optimización de gradiente descendente para reducir el valor de la función de pérdida. Tal lógica para actualizar los correspondientes peso anteriores parámetros del algoritmo de regresión de peso, mejorar la probabilidad de que originalmente pertenecía a una categoría, reduciendo la probabilidad de 0 fue originalmente categorías.

【final】

◆

planes de fuerza

◆

"Plan de Trabajo [el segundo trimestre] - la capacidad de aprendizaje Challenge" comenzó! A partir de ahora hasta el 21 de marzo debe fluir para apoyar el autor original! Exclusiva [más] medalla esperando a que reto

lectura recomendada

Su punto de cada una "mirada", en serio como el AI

Artículos que empiezan estación

AI Tecnología Campo

Liberadas 1350 artículos originales · ganado elogios 10000 + · vistas 6,19 millones +

Sus tablero de mensajes preocupaciones